投稿日: Aug 23, 2022

Amazon Polly はテキストをリアルな音声に変換するサービスです。本日、Polly の中国標準語の女性のテキスト読み上げ (TTS) 音声である「Zhiyu」のニューラルバージョンの一般提供を開始しました。

テキスト読み上げ音声は、音声合成対応のアプリケーションや製品を作成、実装、更新、保守する方法を簡素化します。Amazon Polly を使用すると、ユーザーエクスペリエンスを向上させ、音声の力でテキストコンテンツのアクセシビリティを向上させることができます。一般的なユースケースとしては、自動音声応答 (IVR) システム、オーディオブック、ニュースリーダー、e ラーニングコンテンツ、仮想アシスタントなどがあります。

Amazon Polly は 2018 年に標準テクノロジーを使用して中国標準語の TTS 音声である Zhiyu をリリースしました。今回、Zhiyu のニューラルバージョンも利用可能になりました。新しい音声はより自然なイントネーションで、複数言語が使用されるコードミキシングで英語のパフォーマンスが向上しています。今回のリリースで、Amazon Polly のポートフォリオには 33 の言語と言語変種にわたる 95 種類の音声が組み込まれたことになります。そのうち、21 種類はニューラルエンジンによってサポートされています。

Zhiyu の使用を開始するには、Amazon Polly コンソールにログインして、ドキュメントをご覧ください。詳細については、Amazon Polly テキスト読み上げ音声の詳細リスト、利用可能なリージョンサービスの制限よくある質問を参照し、料金ページにアクセスしてください。