Amazon Web Services ブログ

Amazon Polly が Nexmo の次世代型テキスト読み上げのユースケースを強化

この記事は Nexmo, the Vonage API Platform の プロダクトディレクター、ボイスアンド RTC、Roland Selmer 氏によるゲストブログ記事です。彼は Nexmo についてこのように述べています。「テキストメッセージング、チャット、ソーシャルメディア、音声などを通じて、リアルタイムかつ容易にカスタマーと情報を共有するのに必要なツールを提供することで、デジタルカスタマーエクスペリエンスを再考できるようにします。」

ビジネスがアプリケーションにコミュニケーション機能を統合できるようにするクラウドコミュニケーションプロバイダーとして、Nexmo, the Vonage API Platform は、 当社のカスタマーために提供している合成音声ユースケースの多くに役立つテキスト読み上げ (TTS) ソリューションが必要でした。私たちの選ぶソリューションは、Nexmo のグローバル TTS 製品を強化するために、当社のテクノロジー要件と製品哲学に合致している必要がありました。

Amazon Polly はこれらの基準のすべてを完璧に満たしていました。このパワフルなサービスは、Nexmo の合成音声ユースケースの核となるメインエンジンとなっています。このサービスは言語と音声で幅広い分野を網羅しています。

Amazon Polly を活用した Nexmo ユースケース

Nexmo では、アプリケーショントゥパーソン (A2P) コミュニケーションのインターフェイスとして音声に注目しており、当社のカスタマーがこの最も自然なコミュニケーション方法を第一に独自のアプリケーションに統合できるようにします。Amazon Polly はその屋台骨と言えます。 特に、様々な業界のお客様が次に示す主要なユースケースにおいて、より良いビジネス収益を上げるために、Amazon Polly を活用した TTS を利用することができました。

  • 音声放送
  • 重大な音声アラート
  • 着信通話通知
  • 2 要素認証 (2FA) による PIN コードのフェイルオーバー音声配信

音声放送:

音声放送は Amazon Polly のスケーラビリティと言語サポートに依存するユースケースです。 TTS の電話の発信で A2P マーケティングメッセージを送信することにより、世界中に広がる大量の視聴者を効率的かつ費用効果的に魅了することができます。

Nexmo のカスタマーの音声放送アプリケーションがデータベースから電話番号のリストを作成します。この数字が Nexmo の現地の番号でプロビジョニングされると、すべての受信者には、発信もとがどこであれ、発信者として現地の電話番号が表示されます。相手が電話に出ると、TTS メッセージが流れます。このメッセージには受信者ごとにパーソナライズされた情報を含めることができます。

重大な音声アラート:

重大な問題 (社内の業務上の問題から、大規模な人数の安全を脅かす天災まで) に対しタイミング良く応答できるようにした TTS コミュニケーションでは、音声ベースの重大アラートが電話で重大なメッセージを世界中に届けられるようにします。カスタマーアプリは発生した、または発生しようとしているイベントについて知らなければならない人々に同時通話を開始します。 アプリはアラートを伝えるために、録音された、またはテキスト読み上げメッセージのいずれかを再生します。カスタマーはその後、受信の確認のためにキーを押すよう促す単純なインタラクティブボイスレスポンス (IVR) を介して、メッセージの受信者を追跡できます。

着信通話通知:

着信通話通知のユースケースでは、ビジネスが特定の広告キャンペーンで、Nexmo の仮想番号を関連付けます。将来の予測から、いずれかの番号に着信があった場合、ビジネスの読み上げ対応アプリケーションが対応可能なエージェントに転送し、双方が接続する前に、発信者が電話しているキャンペーンについて視聴可能なメッセージをエージェントに対して再生します。 エージェントは適切な広告キャンペーンスクリプトを呼び出し、より効率的なやり取りのきっかけを作り、適切なコンテキストで発信者にメッセージを伝える準備をすることができます。

2FA における PIN コードのフェイルオーバーボイスデリバリー:

とりわけ、Amazon Polly は Nexmo のフルサービス 2FA ソリューション、Verify において重要な役割を担っています。携帯の電話確認による新規ユーザーの認識以外にも、たとえば、潜在的な登録者に PIN コードを送信し、登録者がその PIN をアプリやウェブサービスで入力するなど、Verify は最初のテキストベースの検証が失敗した際に、PIN コードの提供にテキストの読み上げ機能を使用できます。

私たちの特許取得済みフェイルオーバーロジックを使用することで、Verify は音声での PIN コードや TTS メッセージによるデリバリーを含む、最適なデリバリーチャネルとフェイルオーバーシーケンスを選択します。

私たちのカスタマーはテキストのみから読み上げ対応の Verify ソリューションに移行した時点で、2FA の変換で著しい変化を目にしました。たとえば、トップビットコイン換金マーケットプレイスの BitQuick は、Nexmo Verify を使用するようになって、注文成立率を 35% から 55% まで増大させることに成功しました。その一方で、デプロイから最初の 60 日間で全体の取引量は 2 倍に上りました。

Nexmo のプラットフォームはカスタマーにプログラムでコミュニケーションアプリを増強する力をもたらします。 これにより開発者は、個人の応答やフィードバックを取得するため、また受信者が電話に出なかった場合、かけ直したり、留守番電話にメッセージを残すといったビジネスロジックを実行する単純な IVR などの機能を使って、先に述べたようにどのようなユースケースも許可できます。Amazon Polly の提供する音声合成マークアップ言語 (SSML) を使用することで、開発者はアプリケーションの合成音声がより人間の声に近くなるように特徴を操作することもできます。 また、Nexmo Dashboard のレポートを使用することで、指定したユースケースの有効性をモニターすることもできます。

Nexmo に対応した Amazon Polly ブロック構築モデル

Amazon Polly は私たちの TTS ユースケースに Nexmo が必要とする技術的仕様のボックスすべてをチェックします。 その非常にスケーラブルな AWS クラウドインフラストラクチャ、Amazon Polly サービスの高いアベイラビリティー、幅広い言語対応により、Amazon Polly は論理的な選択肢となりました。しかし、Amazon Polly モデルと Nexmo モデルとの間には、思想的な共通点があり、完ぺきな組み合わせとなります。

Nexmo はその複雑性を取り除き、API を介してインフラストラクチャへの直接アクセスを提供することにより、グローバルな電話方式の大衆化を図り、Amazon は Amazon Polly サービスを介して、合成音声によるテキストの読み上げを大衆化します。 REST API を介した Amazon Polly が提供されたことで、AWS は私たちのサービスへの統合を簡略化しました。

グローバルプラットフォームとしての性質上、Nexmo が世界中のカスタマーの母国語で TTS ユースケースを提供するために、幅広い言語サポートを確保することは極めて重要です。

TTS カスタマーに提供できる私たちのもう一つの利点である秒単位での課金は、Amazon Polly の価格モデルの恩恵と言えます。私たちは使用した分しか支払わなくて済むため、初期費用を吸収する必要がなく、同様の低コストの利点をカスタマーにも提供できるのです。

カスタマーとのやり取りにボイスインターフェイスを使用するビジネスが増大するにつれ、私たちは余裕を持って Amazon Polly をエンジンとして使用しテキスト読み上げユースケースを支援することができます。