Amazon Polly

深層学習を使用して文章をリアルな音声に変換

Amazon Polly は、文章をリアルな音声に変換するサービスです。テキスト読み上げができるアプリケーションを作成できるため、全く新しいタイプの音声対応製品を構築できます。Amazon Polly は、高度な深層学習技術を使用したテキスト読み上げサービスで、人間の声のような音声を合成します。

何十種類ものリアルな音声を多数の言語でサポートしているため、最適な音声を選択して、さまざまな国で対応する音声アプリケーションを構築できます。

Amazon Polly を聴く >>
Amazon Polly のご紹介 (日本語字幕)
言語 女性 サンプルテキスト
英語 Joanna Matthew Hello.Do you speak a foreign language? 1 つの言語だけでは、満たされない。
ポルトガル語 (ブラジル) Vitória Ricardo Oi.Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
デンマーク語 Naja Mads Hej.Taler du et fremmed sprog? Et sprog er aldrig nok.
フランス語 Léa Mathieu Bonjour.Parlez-vous une autre langue que le français? Une langue n'est jamais assez.
日本語 Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
韓国語 Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。
中国標準語 Zhiyu   你好,你会不会说其他外语?只会一种语言是不够的。
スペイン語 Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
Amazon Polly の声、およびサポートされている言語の詳細な一覧は、こちらをご確認ください。

メリット

自然な声

Amazon Polly は数十におよぶ言語と自然な男女の音声を豊富に備えています。Amazon Polly の流暢なテキスト読み上げで、世界中の皆様のユーザーに高品質の音声出力を提供できます。

音声を保存、再配信

Amazon Polly では、生成した音声を追加料金なしで無制限に再生できます。音声ファイルは MP3 や OGC などの標準フォーマットで生成し、クラウドで、またはローカルから、アプリやデバイスでのオフライン再生ができます。

リアルタイムストリーミング

リアルな声と会話型のユーザーエクスペリエンスの配信には一貫した速い応答時間が求められます。Amazon Polly の API に文章を送ると音声をアプリケーションにストリームとして返すため、直ちに音声を再生できます。  

音声出力のカスタマイズとコントロール

Amazon Polly の音声を修正してニーズに合わせる – Amazon Polly は辞書と SSML タグをサポートしており、発音、声量、声の高さ、速度などの音声の「相」をコントロールすることができます。 

 

 

低コスト

Amazon Polly の従量課金制、文字あたり変換の低コスト、無制限の再生は、皆様のアプリケーションに高いコスト効果をもたらします。

ユースケース

コンテンツの作成

音声は、書き言葉や視覚的なコミュニケーションを補完するようにも使えます。音声を声に出すことで、皆様のユーザーに別の情報取得方法を与え、より多くの読者のニーズに応えることができます。Amazon Polly は数十の言語で音声を生成でき、RSS フィード、ウェブサイト、動画などを世界中で見る人に音声を届けることができます。

例: 記事を音声に変換して MP3 でダウンロードする
Polly-1-Content_Creation@2x
Goanimate

「Amazon Polly は、GoAnimate のプラットフォームを使用してアニメーション化するキャラクターにすぐに声を与える機能をユーザーに提供しています。これは、多くの言語で、または承認プロセスを高速化するために本番前環境でビデオを開発するなど、ライブ吹き替えのリソースや時間のいずれかが非現実的であるシナリオで特に役立ちます。音声は当社のアニメーション化前の豊富なアセットにシームレスに統合されているため、GoAnimate の使いやすさは強化され、お客様に効率と市場へのスピードのいずれも提供できています」

– Alvin Hung 氏、GoAnimate、CEO 兼創設者

導入事例 >>

e ラーニング

Amazon Polly により、開発者は音声と同期した顔のアニメーションや、カラオケのような単語のハイライトなどの拡張されたビジュアル機能によって、アプリケーションを提供できます。Amazon Polly により、特定の文、単語、および音が発音されたときの情報を含む追加のメタデータストリームを、簡単にリクエストできます。このメタデータストリームを合成音声のオーディオストリームとともに使用して、お客様はアプリ内でアバターをアニメーション化したり、発音中のテキストをハイライトしたりすることができます。

例: 音声の再生および発音されるテキストのハイライト
Polly-4-Language-Learning@2x
Duolingo

「新しい言語を学習しているときほど正確な発音がより重要とされるユースケースはそう多くありません。Amazon Polly の声はクオリティが高いだけでなく、言語を教える自然な人間の声と同じほど良いと感じています」

– Severin Hacker 氏、Duolingo、CTO

ブログ記事 >>

テレフォニー

Amazon Polly を使用すると、コンタクトセンターでは自然な声で応答できます。Amazon Polly の音声出力をキャッシュ、再生して、Amazon Connect のような対話的な応答 (IVR) システムで、電話をかける人にただちに声をかけることができます。さらに、Amazon Polly の API を活用して、サービスステータス、アカウントや請求書に関する問い合わせ、住所、連絡先情報のような自動化されたリアルタイムの情報を配信できます。

例: 電話システムでのテキスト読み上げ
Polly-2-Customer_Contact_Center@2x
bandwidth-hdr-logo

「Bandwidth では、Amazon Polly を使用して、小型かつ高速で信頼性の高い TTS アプリケーションを構築しました。現在、低コストで高品質の音声を利用できるようになりました。この新しいサービスを構築するためにかかった開発者の労力は、驚くほどわずかでした」

- Yiannis Philipopoulos 氏、Bandwidth、上級ソフトウェア開発者 

ブログ記事 >>
構築を始めましょう。
Amazon Polly の使用を開始する
ご不明な点がおありですか?
お問い合わせ