Amazon Polly の使用を開始する

Amazon Polly は、文章をリアルな音声に変換するサービスです。Polly を使用すると、会話機能を搭載したアプリケーションを作成し、音声に対応したまったく新しいカテゴリの製品を構築することが可能になります。Polly は高度な深層学習テクノロジーを使用した Amazon AI サービスの 1 つで、人間の声のような音声を合成するサービスです。Polly には 24 の言語と 47 の音声が含まれているため、用途に最適な音声を選んで、多くの国で使える音声対応のアプリケーションを簡単に構築できます。

Amazon Polly は安定して応答時間が短いため、リアルタイムの対話が実現できます。Polly の音声はキャッシュして保存できるため、オフライン再生や再配布が可能です。また、Polly は簡単に使用できます。音声に変換するテキストを Polly API に送ると、すぐに Polly からオーディオストリームがアプリケーションに返され、アプリケーションでそれを直接再生することや、MP3 などの標準オーディオファイルとして保存することが可能です。

Polly では、音声に変換した文字数のみ請求されます。Polly によって生成された音声は保存および再生できます。Polly では、文字あたりの変換コストが低く、音声出力の保存と再利用に制限がないため、"Text-to-Speech" 機能をどこでも利用できる費用対効果の高い方法にします。

Amazon Polly のご紹介
1:20
Amazon Polly: AWS re:Invent 2016
言語 女性 男性 サンプルテキスト
英語 Joanna Joey Hello. Do you speak a foreign language? One language is never enough.
デンマーク語 Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
ポルトガル語 (ブラジル) Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
スペイン語 Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
アイスランド語 Dóra Karl Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg.
自然な声

自然な声

Amazon Polly では、47 のリアルな声を 24 の言語でサポートしています。これには、さまざまなアクセントの男性と女性の声が含まれています。Polly はテキストを複数の言語で流暢に発音するため、高品質の音声出力を配信することや、世界中のユーザー向けのアプリケーションを作成することが可能になります。

統合が簡単

統合が簡単

Amazon Polly を使用すると、ウェブサイト、モバイルアプリケーション、デバイスに簡単に声を追加できます。Polly では、スピーチに変換する文章を書いて Polly API に送信するだけで、すぐに Polly が音声ストリームを返します。長い承認プロセスを要する他のソリューションとは異なり、Polly では、Polly の音声をアプリケーションでどのように使用するかという説明や、販売契約への署名の必要がないため、すぐに使用を開始できます。

音声の保存と再配信

音声の保存と再配信

ロイヤルティーや以前に生成した音声を再生するたびに課金される他のソリューションとは異なり、Amazon Polly では追加料金なしで無制限に再生できます。オフラインでの再生も無料です。オフラインで再生するために、音声ファイルを MP3 や OGG のようなさまざまな標準のファイル形式で作成し、携帯電話や IoT デバイスなどのデバイスに保存できます。

 

低コスト

低コスト

Amazon Polly は従量課金制で、文字あたりの変換のコストが低く、無制限に再生できるため、実質的にどのアプリケーションでも音声の合成を可能にする費用対効果の高い方法です。

応答が速い

応答が速い

リアルな声と会話型のユーザーエクスペリエンスの配信には一貫した速い応答時間が求められます。音声対応アプリケーションでは合成された音声をすぐに再生できることが必要です。ナビゲーション向けに音声案内を提供するアプリケーションや、生徒に口頭での指示を伝える e ラーニングアプリケーション、およびリアルタイムの対話を通してユーザーと関わるアプリケーションについて考えてみてください。これらのアプリケーションは、会話の流れの中で応答が知覚遅延なく開始できるときに最も効果的です。Polly の API に送信する文章が長くても、音声をアプリケーションにストリームとして返すため、直ちに声を再生できます。これらの種類の動的な音声による応答は、ユーザーのデバイスで一般的に保存できるものよりもはるかに大量の音声オーディオへのアクセスを必要とします。Amazon Polly はクラウド上にあるため、多種多様な合成音声にアクセスすることが可能です。Polly を使用すると、お客様のアプリケーションは、リアルタイムデータを含むさらに多くの価値ある応答を提供できます。

Amazon Polly を使用すると、ビデオ、プレゼンテーション、またはオンラインのトレーニングコースに音声を簡単に追加できます。Polly では音声を 24 の言語で生成できるため、世界中の利用者が使用するアプリケーションに声を追加することも簡単です。Polly を使用すると、RSS フィード、ニュース、E メールを読んだり、合成された音声をオーディオファイルの形式で保存したりできます。

コンテンツの作成
GoAnimate

「Amazon Polly は、GoAnimate のプラットフォームを使用してアニメーション化するキャラクターにすぐに声を与える機能をユーザーに提供しています。これは、多くの言語で、または承認プロセスを高速化するために本番前環境でビデオを開発するなど、ライブ吹き替えのリソースや時間のいずれかが非現実的であるシナリオで特に役立ちます。音声は当社のアニメーション化前の豊富なアセットにシームレスに統合されているため、GoAnimate の使いやすさは強化され、お客様に効率と市場へのスピードのいずれも提供できています」

– Alvin Hung 氏、GoAnimate、CEO 兼創設者


Amazon Polly を使用すると、カスタマーコンタクトセンターは自然な声で応答できます。Polly の音声出力を音声自動応答 (IVR) システムを通して再生できます。さらに、Polly の API を活用して、サービスステータス、アカウントや請求書に関する問い合わせ、住所、連絡先情報のような自動化されたリアルタイムの情報を配信できます。

カスタマーコンタクトセンター

Amazon Polly では、音声の IoT デバイスへの追加を簡単にまた安価にすることで、新しい IoT ユースケースを可能にします。IoT デバイスは音声を使用して自然な応答と通知を提供するため、アプリケーションにアクセスしやすくなり、ユーザーは画面に頼ることなく情報を消費できます。Polly では、オフラインで再生するために、音声ファイルを生成してデバイスに保存できます。

AWS Lambda を使用して AWS IoT ルールエンジンからイベントに基づく署名付き Polly URL を生成し、デバイスゲートウェイを使用して URL を IoT デバイスに送信することによってリアルな音声をリクエストできるようにします。

IoT

新しい言語の話し方を教えるアプリケーションの利便性を向上させるために Amazon Polly を使用できます。例えば、エンドユーザーが外国語のフレーズをアプリケーションに入力すると、ネイティブスピーカーによる音声を聞くことができます。Polly では 24 の言語がサポートされているため、教師や生徒にはたくさんの選択肢があります。

言語学習
Duolingo

「新しい言語を学習しているときほど正確な発音がより重要とされるユースケースはそう多くありません。Amazon Polly の声はクオリティが高いだけでなく、言語を教える自然な人間の声と同じほど良いと感じています」

– Severin Hacker 氏、Duolingo、CTO


Amazon Polly を使用すると、モバイルアプリケーションとモバイルゲームに簡単に声を追加できます。Polly では、標準の音声応答をデバイスに保存できるほか、ゲーム内のキャラクターの会話、順位表のランキング、ゲームの招待などの動的でリアルタイムの応答も利用できます。

モバイルアプリケーションとデスクトップアプリケーション
Wizkids

「Wizkids では、読み書きの障害を抱えているユーザーを含むすべての方にとってクラウド型のクラスルームをより魅力的で効果的なものにするよう努めています。Amazon Polly は、高品質の "Text-to-Speech" 音声機能を Wizkids AppWriter 製品と統合することで、当社の学習プラットフォームを強化してくれます」

– Stefan Pal 氏、Wizkids、COO


Amazon Polly では、視覚障害者向けにアクセス可能な情報を合成音声の形式で作成して配信することができます。このことは、視力を失った方々がニュースや書籍、E メールのメッセージなどのさまざまなコンテンツを消費する助けになります。

Royal National Institute of Blind People

「私たちは現在、Amazon の "Text-to-Speech" テクノロジーを使用して、公益事業会社、金融機関、およびメディア企業を含む多くの B2B および B2C のお客様や、雑誌や出版物などの顧客対応の資料向けにアクセス可能な情報を合成音声コンテンツの形式で作成し、配信しています。Amazon Polly の発表で、利用者を魅了する信じられないほどリアルな声を配信することでお客様にさらに優れた体験を提供できることを楽しみにしています」

– John Worsfold 氏、Royal National Institute of Blind People、ソリューション実装マネージャー

Polly は簡単に使用を開始できます。文章から音声への生成を数クリックで開始するには、コンソールにサインインします。

まずは無料で始める

サインアップは簡単!Amazon Polly を無料利用枠で 1 年間お試しいただけます。
AWS アカウント作成の流れはこちら ≫
AWS 無料利用枠の詳細はこちら ≫