Amazon Web Services ブログ
SyncWords と AWS を使用したライブスポーツ、ニュース、OTT プラットフォーム向けの低レイテンシーのキャプションと音声翻訳の配信
本稿は、2024年12月19日に AWS Media & Entertainment Blog で公開された “Delivering low-latency captions and voice translation for live sports, news, and OTT platforms with SyncWords and AWS” を翻訳したものです。
本稿は、SyncWords の VP of Business Development and Strategy である Giovanni Galvez と共同執筆しました。
お客様からクラウドの自動音声認識 (Automatic Speech Recognition : ASR) テクノロジーを活用しながら、特にスポーツ中継やニュースのライブ配信で、低遅延でキャプションを実現する最善の方法について問い合わせがありました。AWS と SyncWords は、この課題に取り組み、生放送用のキャプションの埋め込みと音声翻訳を生成するために、Secure Reliable Transport (SRT) プロトコルと SyncWords を使用して、安全で低レイテンシーのキャプション埋め込みワークフローを可能にしました。これらはハードウェアを追加することなく実現されています。
以前のブログでは、HTTP Live Streaming (HLS) ワークフローをデプロイする生放送向けのキャプションと字幕の作成を自動化するために開発された Amazon Web Services (AWS) と SyncWords の実装方法について紹介しています。Multi-language automatic captions and audio dubbing made possible for live events with AWS Media Services and SyncWords と Translate live sports automatically to reach international fans with AWS Media Services and SyncWords は、これらの実装を紹介しており、このブログを読む前に読んでおくと、より理解が深まります。
次のワークフロー図は、SyncWords の SRT ベースのソリューション、映像伝送のための AWS Elemental MediaConnect、映像処理の AWS Elemental MediaLive、オリジンおよびパッケージングサービスの AWS Elemental MediaPackage、配信のための Amazon CloudFront を使用した、自動化された低レイテンシーのキャプション埋め込みと音声翻訳のデプロイを示しています。
SyncWords は SRT の取り込みと出力をサポートし、クラウド内の動画処理ワークフローのための AWS Media Services とネイティブに統合されたクラウドベースの安全なキャプションおよび音声埋め込みソリューションをユーザーに提供します。
MediaLive がSRT Caller 入力をサポートしたことで、SyncWords のキャプション付きのライブストリームを MediaLive に直接取り込むことができます。すべてのコンポーネントが同じ AWS リージョンにあり、MediaConnect が他のワークフロー要件に必要ない場合は、MediaConnect をバイパスできる可能性があります。以下は、MediaLive SRT Caller 入力を使用した簡略化されたワークフロー図です。
MediaConnect とシームレスに連携し、AWS グローバルネットワークを活用することで、クラウドベースの自動音声認識 (ASR)、SyncWords による費用対効果の高いキャプション埋め込みおよび音声翻訳サービスを利用できるようになり、また、MediaConnect による安全で低レイテンシーな伝送により、キャプション付ストリームを世界中の顧客やビジネスパートナーに配信できるようになります。
このワークフローを AWS にデプロイすると、次のような利点があります。
1. 複数の解像度とコーデックのネイティブサポート
CEA-608/CTA-708 キャプションプロトコルを使用して、SD、HD、および UHD (4K) 解像度のキャプションを SRT ストリームに挿入できます。HEVC および AVC ビデオコーデックと互換性があります。キャプションデータをエレメンタリービデオストリームに挿入するときにトランスコーディングは必要なく、1 秒未満で処理されます。
2. Amazon Elastic Kubernetes Services (Amazon EKS) によるスケールするキャプション処理
SyncWords のキャプションと音声翻訳サービスは AWS のサービス上に構築されており、Amazon EKS を用いて自動的にスケーリングします。また、二重パイプラインの冗長性をサポートするためにMediaLive と統合されています。お客様は、オンプレミスハードウェアの管理やプロビジョニングを負担することなく、キャプションサービスに集中できるようになります。サービスの冗長性とスケーラビリティは、高品質で信頼性の高いライブ体験を顧客に提供します。
3. MediaConnectと SRT を使った収益化
放送局は MediaConnect と SRT プロトコルを最大限に活用し、母国語を話す世界中の視聴者に向けてニュースやスポーツのキャプション付きライブストリームを安全に伝送し収益化することができます。さらに、MediaConnect Entitlements を使用して、世界中のビジネスパートナーや顧客にコンテンツを配信できます。
まとめ
このブログでは、AWS サービスと SyncWords を使用して、回復力のある低レイテンシーの SRT ストリーミングワークフローでライブイベントの自動キャプションを有効にする方法について説明しました。AWS を使用したライブイベントパイプラインの作成方法は、AWS でのライブストリーミングソリューションを参照してください。さらに、AWS Media Services を使い始めることに興味がある場合は、製品ページをご覧ください。ライブイベントにキャプションソリューションを統合するためのドキュメントについては、SyncWords をご覧ください。
参考リンク
AWS Media Services
AWS Media & Entertainment Blog (日本語)
AWS Media & Entertainment Blog (英語)
AWS のメディアチームの問い合わせ先:awsmedia@amazon.co.jp
※ 毎月のメルマガをはじめました。最新のニュースやイベント情報を発信していきます。購読希望は上記宛先にご連絡ください。
翻訳はソリューションアーキテクトの金目, 石井が担当しました。原文はこちらをご覧ください。