投稿日: Mar 22, 2018

Amazon Polly は、高度なディープラーニング技術を使用したテキスト読み上げサービスで、人間の声のような音声を合成します。新しい SSML Breath 機能は、通常のスピーチ中の呼吸音を模倣します。SSML の Breath タグを使用すると、適切な呼吸音を挿入することで、Amazon Polly は、まるで人間の話者がそのテキストをナレーションしているように自然な音声を生成できるようになります。

および のタグ、あるいは両方の組み合わせを使用することで、音声出力に呼吸音を組み込むことができます。

  • 自動モード: Amazon Polly は呼吸音を音声出力に自動的に挿入し、ユーザーの入力なしで通常の呼吸をシミュレートします。(また、呼吸音を挿入する頻度、呼吸音の音量、呼吸音の長さを設定することもできます。)
  • 通常モード: ユーザーが、テキスト中での呼吸音の位置、長さ、音量を設定します。
  • 混合モード: ユーザーが挿入する呼吸音、Amazon Polly によって自動的に挿入されるカスタマイズされた呼吸音の組み合わせになります。

テキストからの音声出力に呼吸音を組み込むことにより、Amazon Polly は、特に長いテキスト形式のナレーションで、より自然に聞こえる音声を提供することができます。 

Amazon Polly コンソールにログインして SSML Breath 機能を試してみるか、SSML タグの詳細について Amazon Polly のドキュメントをご覧ください。