Amazon Polly を無料で始める

Amazon Polly は、文章をリアルな音声に変換するサービスで、話すことができるアプリケーションを作成でき、まったく新しいカテゴリの音声対応製品を構築できます。Amazon Polly は、高度なディープラーニング技術を使用したテキスト読み上げサービスで、人間の声のような音声を合成します。

何十種類ものリアルな音声を多数の言語でサポートしているため、最適な音声を選択して、さまざまな国で音声対応アプリケーションを構築できます。

言語 女性 男性 サンプルテキスト
英語 Joanna Matthew Hello. Do you speak a foreign language? One language is never enough.
デンマーク語 Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
ポルトガル語 (ブラジル) Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
スペイン語 Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
日本語 Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
韓国語 Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。

Amazon Polly の声、およびサポートされている言語の詳細な一覧は、こちらを確認してください。


日付

タイトル

筆者

2017 年 11 月 9 日 Modify the Timbre of Amazon Polly Voices with the New Vocal Tract SSML Feature Robin Dautricourt、シニアプロダクトマネージャー、Amazon Polly

2017 年 10 月 19 日

Convert Your Text into an MP3 File with Amazon Polly and a Simple Python Script Dzidas Martinaitis、データサイエンティスト、AWS

2017 年 10 月 12 日

Amazon Polly Expands to the Asia Pacific (Tokyo) Region and Adds Two New Voices Robin Dautricourt、シニアプロダクトマネージャー、Amazon Polly

2017 年 9 月 29 日

Using Amazon Polly to Provide Real-Time Home Monitoring Alerts Siva K. Syamala 氏、シニア開発者、Y-Cam Solutions
2017 年 8 月 30 日 How Amazon Polly Breathed Life into Dan Brown's Digital Assistant Damian Dutton 氏、CEO 兼創設者、Beeliked

Amazon Polly 関連のすべての AI ブログ記事は、こちらからご覧いただけます。


自然な声

自然な声

Amazon Polly では、何十種類ものリアルな音声を複数の言語でサポートしています。これには、さまざまなアクセントの男性と女性の声が含まれています。Amazon Polly はテキストを複数の言語で流暢に発音するため、高品質の音声出力を配信することや、世界中のユーザー向けのアプリケーションを作成することが可能になります。

統合が簡単

統合が簡単

Amazon Polly を使用すると、ウェブサイト、モバイルアプリケーション、デバイスに簡単に声を追加できます。Amazon Polly では、スピーチに変換する文章を書いて Amazon Polly API に送信するだけで、すぐに Amazon Polly が音声ストリームを返します。 長い承認プロセスを要する他のソリューションとは異なり、Amazon Polly では、Amazon Polly の音声をアプリケーションでどのように使用するかという説明や、販売契約への署名の必要がないため、すぐに使用を開始できます。

音声の保存と再配信

音声の保存と再配信

ロイヤルティーや以前に生成した音声を再生するたびに課金される他のソリューションとは異なり、Amazon Polly では追加料金なしで無制限に再生できます。オフラインでの再生も無料です。オフラインで再生するために、音声ファイルを MP3 や OGG のようなさまざまな標準のファイル形式で作成し、携帯電話や IoT デバイスなどのデバイスに保存できます。

 

低コスト

低コスト

Amazon Polly は従量課金制で、文字あたりの変換のコストが低く、無制限に再生できるため、実質的にどのアプリケーションでも音声の合成を可能にする費用対効果の高い方法です。

応答が速い

応答が速い

リアルな声と会話型のユーザーエクスペリエンスの配信には一貫した速い応答時間が求められます。音声対応アプリケーションでは合成された音声をすぐに再生できることが必要です。ナビゲーション向けに音声案内を提供するアプリケーションや、生徒に口頭での指示を伝える e ラーニングアプリケーション、およびリアルタイムの対話を通してユーザーと関わるアプリケーションについて考えてみてください。これらのアプリケーションは、会話の流れの中で応答が知覚遅延なく開始できるときに最も効果的です。Amazon Polly の API に送信する文章が長くても、音声をアプリケーションにストリームとして返すため、直ちに声を再生できます。 これらの種類の動的な音声による応答は、ユーザーのデバイスで一般的に保存できるものよりもはるかに大量の音声オーディオへのアクセスを必要とします。Amazon Polly はクラウド上にあるため、多種多様な合成音声にアクセスすることが可能です。Amazon Polly を使用すると、お客様のアプリケーションは、リアルタイムデータを含むさらに多くの価値ある応答を提供できます。

Amazon Polly を使用すると、ビデオ、プレゼンテーション、またはオンラインのトレーニングコースに音声を簡単に追加できます。Amazon Polly では音声を 24 の言語で生成できるため、世界中の利用者が使用するアプリケーションに声を追加することも簡単です。 Amazon Polly を使用すると、RSS フィード、ニュース、E メールを読んだり、合成された音声をオーディオファイルの形式で保存したりできます。

コンテンツの作成
GoAnimate

「Amazon Polly は、GoAnimate のプラットフォームを使用してアニメーション化するキャラクターにすぐに声を与える機能をユーザーに提供しています。これは、多くの言語で、または承認プロセスを高速化するために本番前環境でビデオを開発するなど、ライブ吹き替えのリソースや時間のいずれかが非現実的であるシナリオで特に役立ちます。音声は当社のアニメーション化前の豊富なアセットにシームレスに統合されているため、GoAnimate の使いやすさは強化され、お客様に効率と市場へのスピードのいずれも提供できています」

– Alvin Hung 氏、GoAnimate、CEO 兼創設者


Amazon Polly により、開発者は音声と同期した顔のアニメーションや、カラオケのような単語のハイライトなどの拡張されたビジュアル機能によって、アプリケーションを提供できます。 Amazon Polly により、特定の文、単語、および音が発音されたときの情報を含む追加のメタデータストリームを、簡単にリクエストできます。 このメタデータストリームを合成音声のオーディオストリームとともに使用して、お客様はアプリ内でアバターをアニメーション化したり、発音中のテキストをハイライトしたりすることができます。

コンテンツの作成

「Wizkids では、読み書きの障害を抱えているユーザーを含むすべての方にとってクラウド型のクラスルームをより魅力的で効果的なものにするよう努めています。Amazon Polly は、高品質の "Text-to-Speech" 音声機能を AppWriter 製品と統合することで、当社の学習プラットフォームを強化してくれます。 読み上げられているテキストがリアルタイムでハイライトされているのを見るのは、ユーザーにとって非常に重要です。 Polly からのスピーチマークを使用して、AppWriter は拡張された読み上げ機能を提供し、読み書きに困難をともなう人々にも公平な環境を提供できます。」

- Stefan Pal 氏、Wizkids、COO


Amazon Polly を使用すると、カスタマーコンタクトセンターは自然な声で応答できます。Amazon Polly の音声出力を音声自動応答 (IVR) システムを通して再生できます。 さらに、Amazon Polly の API を活用して、サービスステータス、アカウントや請求書に関する問い合わせ、住所、連絡先情報のような自動化されたリアルタイムの情報を配信できます。

カスタマーコンタクトセンター

「Bandwidth では、Amazon Polly を使用して、小型かつ高速で信頼性の高い TTS アプリケーションを構築しました。現在、低コストで高品質の音声を利用できるようになりました。この新しいサービスを構築するためにかかった開発者の労力は、驚くほどわずかでした」

– Yiannis Philipopoulos 氏、シニアソフトウェア開発者、Bandwidth


Amazon Polly では、音声の IoT デバイスへの追加を簡単にまた安価にすることで、新しい IoT ユースケースを可能にします。IoT デバイスは音声を使用して自然な応答と通知を提供するため、アプリケーションにアクセスしやすくなり、ユーザーは画面に頼ることなく情報を消費できます。Amazon Polly では、オフラインで再生するために、音声ファイルを生成してデバイスに保存できます。

AWS Lambda を使用して AWS IoT ルールエンジンからイベントに基づく署名付き Polly URL を生成し、デバイスゲートウェイを使用して URL を IoT デバイスに送信することによってリアルな音声をリクエストできるようにします。

IoT

「当社の研究によると、最近の顧客は、AWS 以外のサービスでよくあるような、ロボット的な音声の場合、音声補助スマートセキュリティソリューションを購入しない傾向があります。当社の顧客には、Amazon Polly の人間の声に非常に近い音声が人気です。実際、多くの人が実際の人間の声と感じるほどです」

– Devin Chawda 氏、CEO、Y-Cam Solutions


新しい言語の話し方を教えるアプリケーションの利便性を向上させるために Amazon Polly を使用できます。例えば、エンドユーザーが外国語のフレーズをアプリケーションに入力すると、ネイティブスピーカーによる音声を聞くことができます。Amazon Polly では 24 の言語がサポートされているため、教師や生徒にはたくさんの選択肢があります。

言語学習
Duolingo

「新しい言語を学習しているときほど正確な発音がより重要とされるユースケースはそう多くありません。Amazon Polly の声はクオリティが高いだけでなく、言語を教える自然な人間の声と同じほど良いと感じています」

– Severin Hacker 氏、Duolingo、CTO


Amazon Polly では、視覚障害者向けにアクセス可能な情報を合成音声の形式で作成して配信することができます。このことは、視力を失った方々がニュースや書籍、E メールのメッセージなどのさまざまなコンテンツを消費する助けになります。

Royal National Institute of Blind People

「私たちは現在、Amazon の "Text-to-Speech" テクノロジーを使用して、公益事業会社、金融機関、およびメディア企業を含む多くの B2B および B2C のお客様や、雑誌や出版物などの顧客対応の資料向けにアクセス可能な情報を合成音声コンテンツの形式で作成し、配信しています。Amazon Polly の発表で、利用者を魅了する信じられないほどリアルな声を配信することでお客様にさらに優れた体験を提供できることを楽しみにしています」

– John Worsfold 氏、Royal National Institute of Blind People、ソリューション実装マネージャー

Amazon Polly は簡単に使用を開始できます。 文章から音声への生成を数クリックで開始するには、コンソールにサインインします。

まずは無料で始める

サインアップは簡単!Amazon Polly を無料利用枠で 1 年間お試しいただけます。
AWS アカウント作成の流れはこちら ≫
AWS 無料利用枠の詳細はこちら ≫