この AWS ソリューションの内容

多言語対応自動字幕トラックを使用したライブストリーミングは、ライブストリーミングビデオコンテンツの多言語字幕をリアルタイムで自動的に生成します。このソリューションは簡単にデプロイでき、ライブイベント中にのみ使用されます。ストリーミング終了後ソリューションのスタックを削除することによって、使用するインフラストラクチャに対してのみ支払いを行うことを確実にすることができます。

このソリューションでは、複数の画面でアダプティブビットレートストリーミングを行うためにコンテンツをコード化し、パッケージ化する目的で AWS でのライブストリーミングが使用され、音声をテキストに変換し、多言語でキャプションを生成する目的で AWS LambdaAmazon TranscribeAmazon Translate が使用されます。

このソリューションの目的はリアルタイムで字幕を生成するためのフレームワークを提供することであり、これにより、基盤となるインフラストラクチャ操作の管理ではなく、ソリューション機能の拡張に集中できます。このソリューションは、そのまま使用したり、特定のユースケースに合わせてカスタマイズしたり、AWS パートナーネットワーク (APN) パートナーと連携してエンドツーエンドの字幕付けワークフローを実装したりできます。

AWS ソリューションの概要

AWS はライブストリーミングビデオコンテンツのためのリアルタイム字幕生成ソリューションを提供します。このソリューションでは、Amazon Transcribe、Amazon Translate、AWS Lambda を組み合わせ、ライブストリーミングビデオのために多言語で字幕を自動生成するサーバーレスアーキテクチャを構築します。下の図は、ソリューションの実装ガイドと付属の AWS CloudFormation テンプレートを使用して、自動的にデプロイできるアーキテクチャを表しています。

live-streaming-with-automated-multi-language-subtitling-architecture
live-streaming-with-automated-multi-language-subtitling-architecture
 拡大イメージを見る

多言語対応自動字幕トラックを使用したライブストリーミング

このソリューションの AWS CloudFormation テンプレートには、AWS Elemental MediaLiveMediaPackageAmazon CloudFront が含まれる AWS でのライブストリーミング、Amazon Simple Storage Service (Amazon S3) バケット、Amazon Transcribe、Amazon Translate、2 つの AWS Lambda 機能 (音声をテキストに変換する機能と、MediaPackage に送信される WebVTT 字幕を生成する機能) が採用されています。

字幕生成プロセスは、MediaLive 出力がソリューションの Amazon S3 バケットに送信されたときに開始します。CaptionCreation Lambda 機能はバケットからマニフェストファイルを受け取り、TS 動画セグメントから署名のないパルスコードモジュール (PSM) 音声を抽出し、その PCM 音声を Amazon S3 に保存します。次に、この機能は TranscribeStreaming 機能を呼び出し、それに PCM 音声を与えます。

TranscribeStreaming 機能では Amazon Transcribe ストリーミングトランスクリプションを利用し、音声ストリームをテキストにリアルタイム変換します。この機能は次に、起こした文字を CaptionCreation 機能に戻します。複数の言語が必要になる場合、CaptionCreation 機能は Amazon Translate を呼び出し、起こした文字を翻訳します。

CaptionCreation 機能は WebVTT 字幕ファイルを作成し、それと動画ファイルを MediaPackage に送信します。

MediaPackage は 4 つの MediaPackage カスタム エンドポイントに配信される形式にファイルとパッケージを取り込みます。

MediaPackage カスタムエンドポイントをオリジンとして使用するために、Amazon CloudFront ディストリビューションが設定されます。CloudFront ディストリビューションが、お客様のライブストリームを視聴者に低レイテンシーかつ高速転送で配信します。

多言語対応自動字幕トラックを使用したライブストリーミング

バージョン 1.0.0
最終更新日: 2019 年 3 月
筆者: AWS

見積りデプロイ時間: 20 分

特徴

アクセシビリティ

ライブ動画ストリーミングコンテンツの視聴者を多言語字幕で増やすことで、コンテンツを今までより広範囲の視聴者に届けます。

柔軟性

このソリューションは、そのまま使用したり、特定のユースケースに合わせてカスタマイズしたり、APN パートナー製品を活用してエンドツーエンドの字幕付けワークフローを実装したりできます。
Product-Page_Standard-Icons_01_Product-Features_SqInk
すべての AWS ソリューションを調べる

AWS が構築したソリューションから一般的なアーキテクチャの問題まで、概要をご覧ください。

詳細はこちら 
Next-Steps-Icon_Find-a-Partner-B
パートナーを見つける

サービスの開始をサポートする AWS 認定コンサルティングパートナーとテクノロジーパートナーを見つけましょう。

詳細はこちら 
Product-Page_Standard-Icons_03_Start-Building_SqInk
コンソールで構築を開始する

サインアップしてサービスの使用を開始しましょう。

開始方法