もう見出しで全部いいきっちゃってますが、要するに読み上げツールの1つです。 今のところ24の言語に対応し、言語によっては(日本語は1パターンのみですが)複数のキャラクター選択も可能。もちろんアプリやWebからの呼び出しもカンタンという便利なサービス。 仕組みとしては以下のような感じ つまりテキストを意味分類し、指定言語において『その文脈で読み上げるには何が適切か』をまず判断。 さらにそこから『この文節の並びならこんな抑揚になるはず』という音韻を学習データから作成。調整して出力するイメージらしいですね。 この仕組みなら、例えば日本語特有の『かなカナ仮名&アルファベット混じり』のテキストでも割となんとかしてくれたりしちゃいます。 これは既存テキストを上手く活かしたい場合にかなり有用ですね。安すぎるほど安いですし。 実際のデモ例 別タブで再生する場合はこちら リップシンクに使える?スピーチマーク
![Amazonの侵略。AWS AI ソリューション『Polly』『Rekognition』の凄さ | Ledge.ai](https://cdn-ak-scissors.b.st-hatena.com/image/square/f173163bfd797858fb93c03e356dd6494ec6d854/height=288;version=1;width=512/https%3A%2F%2Fs3-ap-northeast-1.amazonaws.com%2Fledge-assets%2F2017%2F07%2Famazonai_main.jpg)