发布于: Aug 11, 2021
Amazon Chime 开发工具包允许开发人员在其 Web 和移动应用程序中添加实时音频、视频和屏幕共享。从今天开始,开发人员可以使用由 Amazon Transcribe 或 Amazon Transcribe Medical 提供支持的实时音频转录来叠加字幕、构建转录或执行实时内容分析。
为创建实时会议转录并将音频始终留在 AWS 网络内,Amazon Chime SDK 现在包含 Amazon Transcribe 账户的服务端集成。为了提高双方对话场景的转录准确性,用户的音频在混合到会议视频中之前会经过单独处理。Amazon Chime 使用其活跃谈话者算法来选择前两名活跃谈话者,然后通过单条传输流将他们的音频以单独的通道发送到 Amazon Transcribe。为了减少延迟,归结于用户的转录内容会通过数据消息直接发送给每位会议参与者。使用媒体管道捕获会议音频时,也会同时捕获会议的转录信息。
开发人员可以访问 Amazon Transcribe 支持的所有流式传输语言,以及自定义词汇表和词汇表筛选条件等功能。使用 Amazon Transcribe Medical 时,开发人员可以选择专项、对话类型,并可选择提供任何自定义词汇表。适用标准 Amazon Transcribe 和 Amazon Transcribe Medical 费用。
要详细了解 Amazon Chime SDK 和使用 Amazon Transcribe 或 Amazon Transcribe Medical 进行实时转录,请查看以下资源: