投稿日: Nov 24, 2021
Amazon Chime SDK を利用することで、デベロッパーは、リアルタイムの音声、動画、画面共有、およびメッセージング機能をウェブアプリケーションまたはモバイルアプリケーションに追加できます。Amazon Chime SDK は、音声エクスペリエンスの改善に役立つ、機械学習 (ML) ベースのエコーリダクションを提供するようになりました。スピーカーから発せられた音がマイクで拾われ、それが通話に循環して戻ると、音響エコーが会議や打ち合わせのための通話を混乱させます。新しい機械学習ベースのエコーリダクション機能は、2 人以上が同時に話す、複雑なやり取りが発生する条件下において、音響エコーを低減し、音質を維持するように設計されています。
Amazon Chime SDK のエコーリダクションには、Amazon Chime SDK でノイズリダクションを提供するために開発されたテクノロジーである Amazon Voice Focus も含まれています。Amazon Voice Focus は、機械学習と音声と聴覚のモデルを使用して、ファンの歓声、芝刈り機の稼働音、犬の鳴き声などの周囲の雑音や、タイピングや書類を整える音などの前面の雑音を低減します。これにより、雑音が会話やつながりに悪影響を与えないようにします。デベロッパーは、Amazon Chime SDK の CreateMeeting API を介して、エコー削減機能を使用して会議を設定できます。設定後、デベロッパーはさらに、出席者が会議に参加する際に、エコーリダクション用の適切な機械学習モデルを適用することにより、クライアントレベルで機能を有効にする必要があります。
Amazon Chime SDK のエコーリダクションのための処理は、最新のコンピュータとブラウザにおける効率的なオペレーションのために、WebAssembly (WASM) と Single Instruction/Multiple Data (SIMD) を使用してリアルタイムで実行されます。この機能は現在、Amazon Chime SDK for Javascript でご利用いただけます。
Amazon Chime SDK の詳細については、次のリソースを確認してください。
- Amazon Chime SDK のウェブサイト
- Amazon Chime SDK for JavaScript
- Amazon Chime SDK デベロッパーガイド
- Amazon Chime SDK Voice Focus API