投稿日: Jul 17, 2018

Amazon Polly は、文章をリアルな音声に変換するサービスで、話すアプリケーションを作成でき、まったく新しいカテゴリの音声対応アプリケーションを構築するサービスです。本日より、新しい非同期合成タスクを使用して入力テキストに最大 100,000 文字を入力し、出力ファイルを S3 に保存することができます。これにより、ニュース記事や文書などの長い形式のコンテンツの音声作成プロセスが大幅に簡略化されます。

非同期合成タスクを使用すると、堅牢な音声合成マークアップ言語 (SSML) タグを組み込むこともできます。現在、入力テキストには最大 100,000 文字の SSML タグを含めることが可能であり、これは入力テキストの文字制限にはカウントされません。これにより、ブログ投稿、記事、さらには書籍の章など、大量のテキスト本体のスタイルや表現力を非常に高度にコントロールすることができます。

Amazon Polly コンソールで新しい非同期合成機能を試してみるか、コマンドラインインターフェース (CLI) や AWS SDK の詳細情報について Amazon Polly ドキュメントを参照してください。また、この機能の詳細については、Jeff Barr のブログもご覧ください。