Amazon Web Services ブログ

Amazon Transcribe Medical を使用して COVID-19 関連用語の音声テキストの精度を向上させる

世界中がパンデミックの進行具合に合わせて対応しているため、COVID-19 に関連する情報に正確にアクセスし、その情報を利用して分析することは、これまで以上に重要になりました。医療危機に関するトピックは、ニュースレポート、ソーシャルメディア、ビジネス会議、ラジオとポッドキャスト、カスタマーサポートコール、特に臨床医と患者の会話などのさまざまなチャネルを通じて、私生活や仕事におけるさまざまな側面に浸透しています。より多くのデータ分析アプリケーションビルダーが求める医療用音声認識機能では、COVID-19 用語を含む動画と音声をダウンストリーム分析用のテキストに効率的かつ正確に文字起こしすることができます。この記事は、Amazon Transcribe Medicalカスタム語彙を使用して COVID-19 用語をよりよく認識する方法を示しています。

Amazon Transcribe Medical は、音声テキスト変換機能をアプリケーションに追加することを容易にする完全マネージド型の音声認識サービス (ASR) です。深層学習を利用したこのサービスは、すぐに使用できる医療用音声認識モデルを提供しています。このモデルを医療およびライフサイエンスドメインのさまざまな音声アプリケーションに統合できます。これで、カスタム語彙機能を使用して、薬の名前、製品ブランド、医療処置、病気など、より具体的な医療用語を正確に文字起こしできます。文字起こしをしたい用語を入力して、各用語を対応する発音と表示フォームに関連付けることができます。カスタム語彙は、Amazon Transcribe Medical が利用可能なすべての AWS リージョンでご利用いただけます。

COVID-19 固有用語の文字起こし

バッチ (非同期) 文字起こし API とストリーミング (同期) 文字起こし API はどちらもカスタム語彙をサポートしています。この記事では、前者を使用してカスタム語彙のメリットをお見せします。

この使用例では、Amazon Simple Storage Service (Amazon S3) バケットに保存されたオーディオファイル (covid-19.wav) を使用します。Amazon S3 の使用については、Amazon Simple Storage Service の使用開始を参照してください。以下は、音声ファイルの文字起こしです。

「COVID-19 としても知られている 2019 年度コロナウイルス病は、重症急性呼吸器症候群コロナウイルス 2 によって引き起こされる感染症です。略して SARS-CoV-2 です。この病気は、2019 年 12 月に中国の武漢で初めて確認されました。症状には、発熱、咳、息切れなどがあります。この記録を行っている時点では、COVID-19 に対するワクチンや特定の抗ウイルス治療剤はありません」

文字起こしには、COVID-19 固有の医学用語、略語、およびフォーマットが含まれています。

カスタム語彙のサポートなしで音声を文字起こしするには、次の手順を実行します。

  1. Amazon Transcribe Medical コンソールで、[文字起こしジョブ] を選択します。
  2. [ジョブを作成] をクリックします。
  3. [名前] にジョブの名前を入力します。
  4. [音声入力タイプ] で [口述] を選択します。

この記事の音声ファイルには、1 つのスピーカーが含まれています。複数のスピーカーを含む音声ファイルの場合は、[会話] を選択します。

  1. [入力データ] に、Amazon S3 入力ファイルの場所を入力します。
  2. [出力データ] に、出力用の S3 バケットの名前を入力します。
  3. [次へ] を選択します。
  4. [ジョブを構成する – オプション] ページでは、何も変更しないでください。
  5. [作成] を選択します。

文字起こしの結果は、一般的な医学用語 (抗ウイルス薬など) がかなりよく認識されたことを示しています。ただし、コロナウイルスに関連するいくつかの特定の用語は、誤記されているか、まったく認識されていません。次のテキストは、エラー (単語の誤り、スペルの誤り、大文字の誤り、形式の誤り、用語の欠落) を表すために強調表示された用語を含む文字起こしを示しています。

Covad, 19 としても知られている 2019 年度コロナウイルス病は、重症急性呼吸器症候群によって引き起こされる感染症です。コロナウイルス 2 は、スターコウ 2 と略されています。この病気は 2019 年 12 月に中国で、フルタイムで初めて確認されました。症状には、発熱、咳、息切れなどがあります。この記録を行っている時点では、cover 19 に対するワクチンや特定の抗ウイルス治療剤はありません」

機械の文字起こしが行われるのは予想できる結果です。COVID-19 に関連する用語は、最近出現したパンデミック固有のものであり、元の Amazon Transcribe Medical 辞書には含まれていませんでした。しかし今では、カスタム語彙機能を使用して、Amazon Transcribe Medical がこれらの特定の医療用語をより良く認識するように教えることができます。

カスタム語彙の作成

カスタム語彙を作成するには、以下の手順を実行します。

  1. お好みのシンプルなテキストエディタで、カスタム語彙ファイルを作成し、COVID-19 に関連する用語一覧を入力します。

サンプルファイル covid-19-dictionary.txt を使用できます。独自の語彙を作成する手順については、Medical カスタム語彙を参照してください。

カスタム語彙を作成するときは、用語 (Phrase)、希望する出力形式 (DisplayAs)、および対応する発音を国際発音記号 (IPA) を使用して入力します。次のスクリーンショットは、covid-19-dictionary.txt 語彙一覧の例を示しています。

テキストファイルには、対応する表示形式と発音を含むカスタム語彙一覧が含まれています。

  1. ファイルを保存します。この使用例では、covid-19-dictionary.txt という名前を付けます。
  2. ファイルを S3 バケットにアップロードします。この使用例でのフルパスは s3://my-bucket/covid-19-dictionary です。

パス名は、バケットの名前に応じて異なる場合があります。

  1. Amazon Transcribe Medical コンソールで、[カスタム語彙] を選択します。
  2. [語彙を作成]を選択します。
  3. [名前] に語彙の名前を入力します。例: COVID-19-Dictionary。
  4. [Amazon S3 語彙入力ファイルの場所] に、カスタム語彙ファイルへのフルパスを入力します。
  5. [語彙を作成] を選択します。

[カスタム語彙] ページに、カスタム語彙が一覧表示されます。

カスタム語彙の使用

カスタム語彙を使用するには、前のセクションの手順 1〜7 を繰り返して、文字起こしジョブを作成します。次に、以下の手順を実行します。

  1. [ジョブを構成する – オプション] ページの [カスタマイズ] セクションで、[カスタム語彙] を選択します。
  2. 以前作成した語彙を選択してください。
  3. [作成] を選択します。

これで、文字起こしジョブを実行して、新しい文字起こしの出力を確認できます。次の出力では、強調表示された単語は、元々欠落していた正しい文字起こし結果を示しています。

COVID-19 としても知られている 2019 年度コロナウイルス病は、重症急性呼吸器症候群コロナウイルス 2 によって引き起こされる感染症です。略して SARS-CoV-2 です。この病気は、2019 年 12 月に中国の武漢で初めて確認されました。症状には、発熱、咳、息切れなどがあります。この記録を行っている時点では、COVID-19 に対するワクチンや特定の治療抗生物質はありません」

文字起こしで、コロナウイルス、COVID-19、SARS-CoV-2、および武漢という用語を正しく文字起こししました。

カスタム語彙は強力な機能ですが、対象を絞って使用する必要があります。文字起こしの誤検出を軽減するために、300 単語を超える単一の語彙ファイルを使用しないでください。さらに、用語一覧が具体的であるほど、文字起こしの結果が良くなります。

まとめ

この記事では、Amazon Transcribe Medical でカスタム語彙を使用する方法を示しました。私たちはコロナウイルスのパンデミックに取り組むために協力し続けています。その中、音声アプリケーションとデータ分析ソリューションによって、このようなカスタム語彙を使用して、貴重な分析を行うために COVID-19 関連用語を文字起こしできます。

Amazon Transcribe Medical は、バッチ (非同期) とストリーミング (同期) の両方のパブリック API として利用できます。このサービスは、口述と会話のダイナミクスの両方に最先端の医療用文字起こしを提供し、プライマリケア (内科、家庭医学、小児科、産婦人科にまたがる) における米国英語のサポートを提供しています。独自のカスタム医療語彙を作成して、サービスコンソールから今日の医療スピーチを文字起こししてみてください。

 


著者について

Paul Zhao は、AWS Machine Learning のプロダクトマネージャーです。彼は、Amazon Transcribe サービスを管理しています。余暇では、Paul はオートバイが大好きで、木工細工を熱心に楽しんでいます。

 

 

 

Katrin Kirchhoff は、AWS AI のシニアマネージャー兼プリンシパルサイエンティストです。彼女は AWS 言語サービスの機械学習に取り組んでいます。余暇には、旅行や新しい場所の探索を楽しんでいます。

 

 

 

 

Scott Seyfarth は AWS AI のデータサイエンティストです。彼は、Amazon Transcribe および Transcribe Medical サービスの改善に取り組んでいます。Scott はまた、アルメニア語、ジャワ語、アメリカ式英語についての研究を行ってきた音声学者兼言語学者でもあります。

 

 

 

 

Ruoyu Huang は、Amazon Transcribe のソフトウェア開発エンジニアです。 Ruoyu は仕事以外で旅行や美術館の探索を楽しんでいます。