より人に近い声で、さらにラジオ放送に利用する上で十分な声質かどうか、という点は極めて重要でした。Amazon Polly は最も人間に近い音声で、これならラジオ放送に利用してもリスナーに受け入れられると考えました。
Amazon Polly にかかるコストは、年間わずか 400〜800 円で、数年前に導入を検討していた他社サービスと比較すると 1,200 分の 1 程度となっています。これは衝撃的な安さです。
山口 誠二 氏 特定非営利活動法人エフエム和歌山 クロスメディア局長

エフエム和歌山は、和歌山県和歌山市を中心とした聴衆人口約 50 万人を対象に、コミュニティ FM 放送『バナナエフエム』を提供しています。多くの地域コミュニティ放送が、第三セクターなどの形で地方公共団体や民間企業から出資を受け運用されているのに対し、エフエム和歌山はスポンサー収入のみで運用されています。

「スポンサーを獲得しなければ運用していけないので、番組のクオリティやリスナーの満足度にはこだわりを持っています。そのため、なるべくコストをかけずに地域に根ざした質の高い情報提供を目指した運営を行っています。」と言うのは、特定非営利活動法人エフエム和歌山 クロスメディア局長の山口誠二氏です。

また、2017 年 7 月より Amazon Polly を利用した『人工知能アナウンサー・ナナコ』を通して、ラジオニュースや天気予報の放送を行っています。時間通りに放送を開始する放送用ウェブシステム「ONTIME PLAYER」や、24時間、災害情報を再生するアナウンサーソフトウェア「Da Capo」など、エフエム和歌山が開発したシステムと Amazon Polly とを連携することで、アナウンサーやディレクターの確保が困難な時間帯でも、安定したアナウンスクオリティでの無人放送を実現しています。

Amazon Polly の音声を用いたナナコによる、 災害情報を 24 時間再生する「Da Capo」 

エフエム和歌山では少人数のスタッフで最大の能力を発揮できるよう、これまでも番組編成管理システムなど、さまざまなソフトウェアを自社で開発し利用するなど、積極的に IT 技術を活用してきました。「今後も IT を最大限活用し、極限まで効率化されたラジオ放送を行っていきたいと考えています。さらにクラウドを活用することで、災害時の対応力なども高めていく方針です。」(山口氏)

また、災害はいつ発生するか予測できません。エフエム和歌山では、災害時の対応のためにアナウンサーなどの人材を常に確保しておくことが難しいことに加え、災害時には社員の通勤時間帯や休日、深夜にも最新ニュースや天気予報などの情報を効率的に流すことが求められます。これらの課題を解決するために、エフエム和歌山では人工知能アナウンサーの利用を考えました。人工知能アナウンサーにより、1 人でも多くのリスナーにいつでも、適切に情報を伝えられるようにすることで、災害が起こった際には人の命を救うことにもつながると考えたのです。

エフエム和歌山では、人工知能アナウンサーを実現するために、ニュース原稿を自動で読み上げるソフトウェアの導入を検討しましたが、コストが高く導入には至りませんでした。その後クラウドの普及により、安価に利用できる性能の高いテキスト読み上げのサービスが登場したことで、再び人工知能アナウンサーの実現の検討をはじめました。そしてテキストデータを読み上げるクラウドサービスのいくつかを比較した結果、エフエム和歌山が選んだのが AWS の Amazon Polly でした。

いくつかのサービス比較したところ、どのサービスもテキストの読み間違えは多少ありましたが、そのような状況の中 Amazon Polly が選ばれた最も大きな理由が、読み上げの声質でした。「より人に近い声で、さらにラジオ放送に利用する上で十分な声質かどうか、という点は極めて重要でした。Amazon Polly は最も人間に近い音声で、これならラジオ放送に利用してもリスナーに受け入れられると考えました。」(山口氏)

もう 1 つの選択理由は、レスポンススピードの速さでした。Amazon Polly は、遅い場合でも 2 秒以内でレスポンスが返ってきます。そのためデータをクラウドに渡して読み上げた結果を一旦ダウンロードしてから再生するのではなく、再生時にデータをロードするといった使い方ができます。これにより録音を流すのとは異なり、リアルタイムにデータを変更しながら放送できると判断されました。

また、企業のビジネス利用から個人のブログまで、開発者向けのリファレンスが多かったという点も、採用のポイントになりました。「Amazon Polly を既に利用している数多くのユーザーが、今まで試行錯誤して解決した情報を容易に得ることができるため、とても助かっています。さらに AWS にはユーザー同士の強力なコミュニティも存在し、それもまた開発する上では安心材料になりました。」(山口氏)  

「エフエム和歌山様 システム構成図」

エフエム和歌山では、2017 年 4 月中旬から Amazon Polly を活用する人工知能アナウンサーの開発を開始しました。約 1 ヶ月という短期間で開発が完了し、6 月から試験放送を開始、7 月には早くも人工知能アナウンサー『ナナコ』の本格運用が始まりました。現在では日本語で入力されたニュース原稿などを日本語で読み上げ放送するだけでなく、自動翻訳を用いた英語での放送も並行して行われています。 

また、エフエム和歌山では『ナナコ』の仕組みを構築する際、アプリケーションのセキュリティ強化のため Amazon Cognito も活用しています。「新しいサービスである Amazon Polly や Amazon Cognito を利用する際にも使い慣れた JavaScript や PHP、Perl などを用いることができました。特別な開発スキルの習得が必要なかったことも、開発を迅速に行うことにつながりました。また、Amazon Polly にかかるコストは、年間わずか 400〜800 円で、数年前に導入を検討していた他社サービスと比較すると 1,200 分の 1 程度となっています。これは衝撃的な安さです。」(山口氏)

人工知能アナウンサーの『ナナコ』は、さっそく災害時にその効果を発揮しました。2017 年 9 月に発生した台風 18 号の影響で、和歌山市内では最大 4,400 世帯が停電する被害が発生しました。この時『ナナコ』は、台風通過中の 5 時間の間、連続で天気、災害情報をアナウンスし続けたのです。これは録音した情報を単に繰り返したわけではありません。提供される情報は随時更新され、Amazon Polly を用いて最新の情報で放送が行われました。数あるテレビやラジオ局の中で、情報を更新しながら提供し続けたのはエフエム和歌山の『ナナコ』だけでした。

Amazon Polly を活用した人工知能アナウンサー『ナナコ』の登場により、エフエム和歌山では台風襲来などの災害に備えたアナウンサーを確保する必要がなくなりました。災害時などには『ナナコ』の利用が標準となり、突発する大規模災害の対策でも『ナナコ』の利用を第一に考えるようになったとのことです。また初期導入時には『ナナコ』の放送に違和感を持ったリスナーもいましたが、今では多くのリスナーに支持され、エフエム和歌山のパーソナリティーの 1 人として『ナナコ』が大きな存在感を持つようになっています。

「早朝、深夜でも最新情報を放送でき、災害時にも連続して情報をアナウンスできるようになりました。『ナナコ』は人の力では不可能だった放送を可能にしています。そう考えると Amazon Polly は、ラジオを再発明したと言えるのではないでしょうか。」(山口氏) 

エフエム和歌山では、ニュースや天気予報だけでなく『ナナコ』を利用した DJ 番組の放送も開始しています。この番組では、システムが自動で曲を選び『ナナコ』が曲のイントロの間に曲紹介を行います。曲名に使われている固有名詞などは人でも読み難いものがあるため、適宜カタカナにデータを修正するなど人の手間をかける必要があります。ニュース原稿も同様で、Amazon Polly が上手く読めない文章については、原稿のデータに適宜句読点を追加するなどのデータ加工を行っています。そういった手間についても、今後 Amazon Polly の読み上げ精度が上がるにつれて削減できると期待されています。

これを実現するためにも、エフエム和歌山では、Amazon Polly だけでなく音声やテキストを使用した会話型インターフェイスの Amazon Lex や、サーバーレスの仕組みの AWS Lambda など、AWS が提供する新しい技術にも高い期待と関心を寄せています。

「声は最強のプッシュ通信であり、とてつもない力があると考えています。災害時、ラジオから人の声で語りかけられることで癒やされる人たちが大勢います。また、人間の話す言葉には感情を入れることができるように Amazon Polly の音声にも将来的には感情が入るようになることも期待しています。エフエム和歌山では、こういった新しい技術を活用した 100 年先を見据えたラジオ放送を提供していきたいと考えています。」(山口氏) 

- 特定非営利活動法人エフエム和歌山
クロスメディア局長
山口 誠二 氏

AWS の人工知能・機械学習サービスが企業でどのように役立つかに関する詳細は、AWS での機械学習の詳細ページをご参照ください。