Amazon Polly は、文章をリアルな音声に変換するサービスです。テキスト読み上げができるアプリケーションを作成できるため、まったく新しいタイプの音声対応製品を構築できます。Polly は、高度なディープラーニング技術を使用したテキスト読み上げ (TTS) サービスで、自然に聞こえるように人間の音声を合成します。何十種類ものリアルな音声を多数の言語でサポートしているため、さまざまな国に対応した音声アプリケーションを構築できます。
Amazon Polly は、標準 TTS 音声に加えて、新しい機械学習アプローチによる音声品質の高度な改善を実現するニューラルテキスト読み上げ (NTTS) 音声を提供します。Polly のニューラルテキスト読み上げテクノロジーは、話し手の配信スタイルをアプリケーションにより一致させる 2 つの発話スタイルをサポートします。ニュースナレーションのユースケースに合わせたニュースキャスターの発話スタイルと、電話アプリケーションのような通信発話スタイルの双方にとって理想的な会話の発話スタイルです。
最後に、Amazon Polly ブランド音声では組織のカスタム音声を作成できます。これは、、組織専用のニューラルテキスト読み上げ (NTTS) 音声を作成するために Amazon Polly チームと連携するカスタムエンゲージメントです。詳細はこちらをご覧ください。
言語 | 女性 | 男 | サンプルテキスト |
英語 | Hello.Do you speak a foreign language? 1 つの言語だけでは、満たされない。 | ||
ポルトガル語 (ブラジル) | Vitória | Ricardo | Oi.Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante. |
デンマーク語 | Naja | Mads | Hej.Taler du et fremmed sprog? Et sprog er aldrig nok. |
フランス語 | Léa | Mathieu | Bonjour.Parlez-vous une autre langue que le français? Une langue n'est jamais assez. |
日本語 | Mizuki |
Takumi | こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。 |
韓国語 | Seoyeon | 안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。 | |
中国標準語 | Zhiyu | 你好,你会不会说其他外语?只会一种语言是不够的。 | |
スペイン語 | Penélope | Miguel | Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente. |
利点
自然な声
Amazon Polly は数十におよぶ言語と自然な男女の音声を豊富に備えています。Amazon Polly の流暢なテキスト読み上げで、世界中の皆様のユーザーに高品質の音声出力を提供できます。
音声を保存、再配信
Amazon Polly では、生成した音声を追加料金なしで無制限に再生できます。音声ファイルは MP3 や OGC などの標準フォーマットで生成し、クラウドで、またはローカルから、アプリやデバイスでのオフライン再生ができます。
リアルタイムストリーミング
リアルな声と会話型のユーザーエクスペリエンスの配信には一貫した速い応答時間が求められます。Amazon Polly の API に文章を送ると音声をアプリケーションにストリームとして返すため、直ちに音声を再生できます。
音声出力のカスタマイズとコントロール
Amazon Polly の音声を修正してニーズに合わせる – Amazon Polly は辞書と SSML タグをサポートしており、発音、声量、声の高さ、速度などの音声の「相」をコントロールすることができます。
低コスト
Amazon Polly の従量課金制、文字あたり変換の低コスト、無制限の再生は、皆様のアプリケーションに高いコスト効果をもたらします。
日本国内のお客様導入事例
「より人に近い声で、さらにラジオ放送に利用する上で十分な声質かどうか、という点は極めて重要でした。Amazon Polly は最も人間に近い音声で、これならラジオ放送に利用してもリスナーに受け入れられると考えました。Amazon Polly にかかるコストは、年間わずか 400〜800 円で、数年前に導入を検討していた他社サービスと比較すると 1,200 分の 1 程度となっています。これは衝撃的な安さです」
- 特定非営利活動法人エフエム和歌山 クロスメディア局長 山口 誠二 氏
ユースケース
コンテンツの作成
音声は、書き言葉や視覚的なコミュニケーションを補完するようにも使えます。音声を声に出すことで、皆様のユーザーに別の情報取得方法を与え、より多くの読者のニーズに応えることができます。Amazon Polly は数十の言語で音声を生成でき、RSS フィード、ウェブサイト、動画などを世界中で見る人に音声を届けることができます。


「Amazon Polly は、GoAnimate のプラットフォームを使用してアニメーション化するキャラクターにすぐに声を与える機能をユーザーに提供しています。これは、多くの言語で、または承認プロセスを高速化するために本番前環境でビデオを開発するなど、ライブ吹き替えのリソースや時間のいずれかが非現実的であるシナリオで特に役立ちます。音声は当社のアニメーション化前の豊富なアセットにシームレスに統合されているため、GoAnimate の使いやすさは強化され、お客様に効率と市場へのスピードのいずれも提供できています」
– Alvin Hung 氏、GoAnimate、CEO 兼創設者
e ラーニング
Amazon Polly により、開発者は音声と同期した顔のアニメーションや、カラオケのような単語のハイライトなどの拡張されたビジュアル機能によって、アプリケーションを提供できます。Amazon Polly により、特定の文、単語、および音が発音されたときの情報を含む追加のメタデータストリームを、簡単にリクエストできます。このメタデータストリームを合成音声のオーディオストリームとともに使用して、お客様はアプリ内でアバターをアニメーション化したり、発音中のテキストをハイライトしたりすることができます。


「新しい言語を学習しているときほど正確な発音がより重要とされるユースケースはそう多くありません。Amazon Polly の声はクオリティが高いだけでなく、言語を教える自然な人間の声と同じほど良いと感じています」
– Severin Hacker 氏、Duolingo、CTO
テレフォニー
Amazon Polly を使用すると、コンタクトセンターでは自然な声で応答できます。Amazon Polly の音声出力をキャッシュ、再生して、Amazon Connect のような対話的な応答 (IVR) システムで、電話をかける人にただちに声をかけることができます。さらに、Amazon Polly の API を活用して、サービスステータス、アカウントや請求書に関する問い合わせ、住所、連絡先情報のような自動化されたリアルタイムの情報を配信できます。


「Bandwidth では、Amazon Polly を使用して、小型かつ高速で信頼性の高い TTS アプリケーションを構築しました。現在、低コストで高品質の音声を利用できるようになりました。この新しいサービスを構築するためにかかった開発者の労力は、驚くほどわずかでした」
- Yiannis Philipopoulos 氏、Bandwidth、上級ソフトウェア開発者
Amazon Polly の詳細