音声を文字起こしする

Amazon Transcribe を使用

このステップバイステップチュートリアルでは、Amazon Transcribe を使用して録音された音声ファイルからテキスト原稿を作成する方法を学習します。これには、AWS マネジメントコンソールを使用します。Amazon Transcribe は、開発者が音声をテキストに変換する機能をアプリケーションに簡単に追加できるようにする、自動音声認識 (ASR) サービスです。Amazon Transcribe API を使用して、Amazon Simple Storage Service (S3) に保存された音声ファイルを分析し、音声を文字起こししたテキストファイルを作成できます。

開発者にとって、カスタマーサポートへの通話の文字起こしや、音声および動画コンテンツの字幕生成は、音声をテキストに変換する機能を必要とする一般的な課題です。この課題は、独自の機械学習モデルを最初から構築することによって解決できるかもしれません。ただし、このオプションには時間とコストがかかり、機械学習の専門知識が必要です。こうした難しい方法を選択するのではなく、事前にトレーニングされたフルマネージドサービスの Amazon Transcribe を使用すれば、高品質の文字起こしを短時間で実行できます。

このチュートリアルでは、サンプルの音声ファイルをダウンロードして、これから作成する S3 バケットにアップロードします。そして、Amazon Transcribe を使用してサンプルの音声クリップの文字起こしを行います。これには AWS マネジメントコンソールを使用します。

このチュートリアルは、AWS CLI または Transcribe API を使用する際に利用可能な機能のデモです。本番環境または PoC (概念実証) の実施に関しては、Amazon Transcribe コンソールではなく、これらのプログラムによるインターフェイスを使用することをお勧めします。

このチュートリアルには AWS アカウントが必要です

Amazon Transcribe の無料利用枠を使用すると、簡単に使用を開始できます。AWS アカウントを作成してから最初の 12 か月間は、無料で 1 か月あたり最大 60 分間の音声を文字起こしすることができます。

無料利用枠の詳細 >>


ステップ 1:S3 バケットを作成し、サンプルの音声ファイルをアップロードする

このステップでは、サンプルの音声ファイルをダウンロードし、これを S3 バケットにアップロードします。Transcribe は、文字起こしをする S3 バケットの音声ファイルまたは動画ファイルのみにアクセスします。


a.  ここをクリックすると、このチュートリアルの後半で文字起こしをするサンプルの音声ファイルがダウンロードされます。ファイル名は、transcribe-sample.mp3 です。


b.  ここをクリックすると、AWS マネジメントコンソールが新しいブラウザウィンドウで開くため、このステップバイステップガイドを開いたままで操作できます。画面の読み込みが終わったら、ユーザー名とパスワードを入力して作業を開始します。[リージョン] ドロップダウンで、Amazon Transcribe が利用可能なリージョンを選択します。

このチュートリアルの作成時点で、Amazon Transcribe は、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、アジアパシフィック (シドニー)、カナダ (中部)、欧州 (アイルランド) のリージョンでご利用いただけます。

create-audio-transcript-transcribe-step-1b

(クリックして拡大)


c.検索バーに「S3」と入力し、[S3] を選択してコンソールを開きます。

create-audio-transcript-transcribe-step-1c

(クリックして拡大)


d.  S3 ダッシュボードで、[Create bucket (バケットを作成)] を選択します。

バケットを初めて作成した場合は、ここに示されている画像のような画面が表示されます。

S3 バケットを既に作成している場合は、すべての作成済みのバケットが S3 ダッシュボードに一覧表示されます。

create-audio-transcript-transcribe-step-1d

(クリックして拡大)


e.  一意のバケット名を入力します。バケット名は、Amazon S3 内の既存バケット名の中で一意である必要があります。S3 バケット名の制約は、他にも多数あります。次に、バケットを作成するリージョンを選択します。

[次へ] を選択します。

create-audio-transcript-transcribe-step-1e

(クリックして拡大)


f.  バージョニングサーバーアクセスロギングタグオブジェクトレベルのロギングデフォルトの暗号化など、S3 バケットには役立つ多数のオプションがあります。このチュートリアルでは、こうしたオプションを無効にしておきます。

[次へ] を選択します。

create-audio-transcript-transcribe-step-1f

(クリックして拡大)


g.  このステップでは、作成プロセス中の S3 バケットの権限設定を調整できます。

デフォルト値をそのままにして、[次へ] を選択します。

create-audio-transcript-transcribe-step-1g

(クリックして拡大)


h.  構成設定を確認し、[Create bucket (バケットを作成)] を選択します。

create-audio-transcript-transcribe-step-1h

(クリックして拡大)


i.  S3 コンソールに新しいバケットが表示されます。バケットの名前をクリックして、そのバケットに移動します。表示されるバケット名は、右のスクリーンショットのものとは異なります。

create-audio-transcript-transcribe-step-1i

(クリックして拡大)


j. バケットのホームページに移動しました。

[Upload (アップロード)] を選択します。

create-audio-transcript-transcribe-step-1j

(クリックして拡大)


k.  [ファイルを追加] を選択して transcribe-sample.mp3 ファイルを選択するか、transcribe-sample.mp3 をアップロード用のボックスにドラッグして、このファイルをアップロードします。

[アップロード] を選択します。

create-audio-transcript-transcribe-step-1k

(クリックして拡大)


l.  バケット内にある [transcribe-sample.mp3] ファイルの横のチェックボックスをオンにします。transcribe-sample.mp3 ファイルの詳細を示すペインが表示されます。ファイルへのリンクをコピーして保存し、このチュートリアルの後半で使用できるようにします。

create-audio-transcript-transcribe-step-1l

(クリックして拡大)


ステップ 2:文字起こしジョブを作成する

このステップでは、Amazon Transcribe コンソールを使用して、文字起こしジョブを作成および実行します。


a.  最上部のメニューバーから [サービス] を選択し、次に検索バーに「Transcribe」と入力し、[Amazon Transcribe] を選択してサービスコンソールを開きます。

create-audio-transcript-transcribe-step-2a

(クリックして拡大)


b.  Amazon Transcribe コンソールのメインページで、ナビゲーションペインを開いて [Transcription jobs (文字起こしジョブ)] をクリックします。

c.[Transcription jobs (文字起こしジョブ)] ページで、[ジョブの作成] をクリックします。

create-audio-transcript-transcribe-step-2b

(クリックして拡大)


d.  [Create transcription job (文字起こしジョブの作成)] ページで、[名前] フィールドに「sample-transcription-job」と入力します。

[言語] はデフォルト値の [English] のままにしておきます。

[Input file location on S3 (S3 内の入力ファイルの場所)] フィールドで、S3 バケット内のサンプルファイルへのリンクを貼り付けます。サンプルファイルへのリンクは、右のスクリーンショットに表示されているものとは異なります。 

[形式] はデフォルト値の [mp3] のままにしておきます。

カスタム語彙機能を利用して、アプリケーション固有の語句やフレーズを Amazon Transcribe に認識させることができます。例えば、Etienne のような英語ではない名前です。このチュートリアルでは、この機能は使用しません。

create-audio-transcript-transcribe-step-2c

(クリックして拡大)


e.  [Data location (データの場所)] はデフォルト値の [Amazon default (Amazon のデフォルト)] のままにしておきます。

[Channel identification (チャネル識別)] を有効にすると、Amazon Transcribe では、別々のチャネルで記録された各話者の音声を処理して、チャネルラベルが追加された単一のスクリプトを生成することができます。

[Speaker identification (話者の識別)] を有効にすると、Amazon Transcribe では話者の変更を認識して、文字起こしテキストに適切な属性を設定できます。

このチュートリアルでは、どちらの機能も使用しません。

[作成] を選択して、文字起こしのジョブを開始します。 

create-audio-transcript-transcribe-step-2d

(クリックして拡大)


ステップ 3:文字起こしの結果を確認する

このステップでは、文字起こしジョブの進捗状況を確認し、結果を確認する方法を学習します。


a.  [Create (作成)] ボタンをクリックすると、[Transcription jobs] 画面が表示されます。この画面には、sample-transcription-job のステータスが表示されます。ステータスは、[In progress]、[Complete]、または [Failed] のいずれかになります。

ステータスが [Complete] になったら、[Name] 列の sample-transcription-job のリンクをクリックして文字起こしの結果を確認します。

create-audio-transcript-transcribe-step-3a

(クリックして拡大)


b.   次に、sample-transcription-job の詳細を確認します。[Transcription] パネルまで下にスクロールして、文字起こしジョブの出力を確認します。文字起こしの結果が Transcribe API または AWS CLI から返され、[JSON] ペインで確認できます。

create-audio-transcript-transcribe-step-3b

(クリックして拡大)


ステップ 4:リソースを終了する

このステップでは、S3 バケットからサンプルファイルを削除し、不要な請求を回避します。


a.  上部のナビゲーションメニューで [サービス] をクリックし、検索バーに「S3」と入力し、[S3] を選択してコンソールを開きます。

create-audio-transcript-transcribe-step-4a

(クリックして拡大)


b.  S3 バケットをスクロールして、このチュートリアルの前半で作成したバケットを探します。このバケット名をクリックして、バケットの内容を確認します。バケット名は、右のスクリーンショットのものとは異なります。

create-audio-transcript-transcribe-step-4b

(クリックして拡大)


c.  バケットに含まれている [transcribe-sample.mp3] ファイルを選択し、[アクション] メニューから [Delete (削除)] を選択します。削除されたことを確認します。

create-audio-transcript-transcribe-step-4c

(クリックして拡大)


お疲れ様でした。

このチュートリアルで確認したように、Amazon Transcribe では、規模に応じて音声をテキストに変換できます。Amazon Transcribe は、カスタマーサポートへの通話、ビジネスの会議、ブロードキャストテレビ、オンデマンドの動画といったさまざまな音声または動画のファイルに使用できます。

 

規模に応じたテキスト翻訳について学習する

この 10 分間のチュートリアルで、Amazon Translate を使用して、文字起こししたテキストを他の言語に翻訳する方法をご確認ください。

Transcribe API と CLI の使用を開始する

このチュートリアルドキュメントで、Amazon Transcribe API と CLI を使用する方法をご確認ください。

Amazon Comprehend を使用する

この 10 分間のチュートリアルで、Amazon Comprehend を使用してテキストの感情を分析する方法をご確認ください。