Amazon Web Services ブログ

ご利用の WordPress ブログに新しい Amazon Polly の声を

私は最初、皆さまに 2016 年後半に Polly について、 「Amazon Polly – 24 か国語 47 種類の声で音声変換」の投稿でお話ししました。 AWS re:Invent が起動した後、韓国語、5 種類の新しい声のサポートを追加し、Polly を aws パーティションのすべてのリージョンで利用可能にしました。また、ウィスパリングスピーチマークティンバーエフェクト、および ダイナミックレンジ圧縮などの機能を備えています

新しい WordPress プラグイン
当社は今日、お客様のブログ投稿の高品位音声バージョンを作成するために、WordPress プラグインを使い始めています。Amazon Pollycast と呼ぶ機能を使用して、投稿中やポッドキャスト内の音声にアクセスできます! 両方のオプションにより、お客様のコンテンツにより容易にアクセスできるようになり、より広い対象者に達することを支援できます。このプラグインは、AWS アドバンストテクノロジーパートナーである WP Engine の AWS チームの共同作業でした。

ご覧の通り、このプラグインのインストールと構成は容易です。お使いのインフラストラクチャまたは AWS 上で実行する WordPress のインストレーションと共に使用できます。いずれの方法でも、Polly のすべての音声に幅広い構成オプションと共にアクセスできます。 生成される音声 (各投稿の MP3 ファイル) は、WordPress コンテンツと共に保存するか、Amazon Simple Storage Service (S3) に保存し、その際に、Amazon CloudFront 経由のコンテンツ配布のための任意のサポートが利用できます。

プラグインのインストール
既存の WordPress 対応具ログがないため、次の WordPress 4.8.1 bluepring を使用して、Lightsail インスタンスを起動することから始めました。

その後、次の指示に従って、私のログイン認証情報にアクセスします。

認証情報を手に入れて、次の通り、WordPress ダッシュボードにログインします。

このプラグインは、AWS をコールするため、認証情報が必要になります。IAM コンソールに移動して、新しいポリシーを作成しました。このポリシーにより、プラグインは注意深く選択された S3 および Polly 機能にアクセスできるようになります (ポリシー全文は、README を参照してください)。

次に、IAM ユーザー (wp-polly-user) を作成します。次の通り、名前を入力して、プログラムによるアクセスに使用することを示します。

その後、作成したばかりのポリシーを添付して、[確認] をクリックします。

設定 (表示されていない) を見直し、[ユーザーの作成] をクリックします。次に 2 つの値 (Access Key ID と Secret Access Key) を安全な場所にコピーします。これらのキーを所有することにより、ベアラーが AWS をコールし、周りにそのまま放置しないようにすることができます。

では、プラグインのインストールの準備ができました! WordPress ダッシュボードに戻り、[プラグイン] メニューの [新規作成] をクリックします。

次に、[プラグインのアップロード] をクリックし、[WordPress プラグイン] サイトからダウンロードした ZIP ファイルを探します。それを見つけた後で、[今すぐインストール] をクリックして先に進みます。

WordPress がプラグインをアップロードし、インストールします。ここで、[プラグインの有効化] をクリックして先に進みます。

プラグインをインストールし、[設定] をクリックして、それを設定します。

自分のキーを入力し、[変更の保存] をクリックします。

[全般] 設定では、サンプルレート、音声、プレイヤーポジション、新規ポストのデフォルト設定、自動再生オプションを設定します。始めるためには、設定のすべてをそのままにしておくことができます。

[クラウドストレージ] 設定では、S3 に音声を保存し、音声を配布するために、CloudFront を使用できます。

[Amazon Pollycast] 設定は、生成された RSS フィードに含まれる iTunes パラメーターを管理できるようにします。

最後に、[一括更新] ボタンはその他の設定を変更した後で、すべての音声ファイルを再生成できるようにします。

プラグインをインストールし、構成すると、新規投稿を作成できます。ご覧のとおり、プラグインを各投稿に対して有効にして、カスタマイズできます。

クリックすると変換するための費用を確認できます。

[発行] をクリックすると、プラグインがテキストを文章の切れ目で複数のブロックに分け、各ブロックに対して、PollySynthesizeSpeech API をコールして、結果の音声を 1 つの MP3 ファイルに蓄積します。発行されるブログ投稿は、 <audio> タグを使用して、ファイルを参照します。投稿は次のようになります。

この投稿では、 <audio> タグを使用しているように見えませんが、ご希望であれば、MP3 ファイルをダウンロードして、再生することができます。

Pollycast 機能は、次のように、各投稿の MP3 ファイルへのリンクをもつ RSS ファイルを生成します。

料金表
プラグインは、投稿が保存されるか、更新されるたびに、Amazon Polly をコールします。料金表は、Polly 料金表ページに記載されているとおり、スピーチリクエストの文字数に基づいています。また、AWS 無料利用枠を利用して、Polly を最初にコールしたときから開始して、1 年間、1 か月あたり 500 万文字を処理できます。

さらに進む
このプラグインは、GitHub にソースコードの形式で提供されているため、お客様のリクエストをいただくことを楽しみにしています。手始めにいくつかのアイデアをご紹介しておきます。

作成者ごとの音声 – 各作成者に対して、個別の Polly 音声を選択できます。

引用テキスト – 埋め込み引用を頻繁に使用するブログの場合は、引用の部分に別の音声を使用します。

翻訳 – Use Amazon Translate を使用して、テキストを別の言語に翻訳し、Polly を使用してその言語で音声を生成します。

その他のブログエンジン – お気に入りのブログエンジンに対して同様のプラグインを構築します。

SSML サポート – Polly の SSML タグを使用して、音声に追加の特徴を加える興味深い方法を探してみましょう。

皆様からのご感想をお待ちしています。

ジェフ;