Amazon Bedrock 数据自动化功能现支持增强转录文本
发布于:
2025年10月1日
Amazon Bedrock 数据自动化 (BDA) 功能现在支持增强的音频转录文本输出功能,可区分不同发言者并分别处理来自各个声道的音频。此外,BDA 还通过基于自然语言的引导式界面扩展了蓝图创建支持,可提取音频模态的定制化洞察。BDA 是 Amazon Bedrock 的一项功能,可自动从非结构化多模态内容(例如文档、图像、音频和视频)中为生成式 AI 驱动的应用程序生成洞察。此次更新后,开发人员可在标准输出中启用发言者日志化与声道识别功能。发言者识别功能可检测每一位独特的发言者,在多方音频对话中追踪发言者切换。声道识别使得每个声道中的音频都能够被独立处理。例如,客户与销售代表等发言者可被划分到唯一的声道,从而更便于对转录文本进行分析。
发言者识别与声道识别技术功能可提高多方语音对话中转录文本的可读性,并从中提取定制化洞察,适用于客户通话、教育课程、公共安全呼叫、临床讨论以及会议等场景。这使客户能够提高员工效率、为网络研讨会添加字幕、提升客户体验或增强合规性。例如,远程医疗客户可通过将医生和患者分配至预先识别的声道来总结医生的建议。
Amazon Bedrock 数据自动化功能共已在 7 个 AWS 区域推出:美国西部(俄勒冈州)、美国东部(弗吉尼亚州北部)、GovCloud(美国西部)、欧洲地区(法兰克福)、欧洲地区(伦敦)、欧洲地区(爱尔兰)、亚太地区(孟买)和亚太地区(悉尼)。要了解更多信息,请访问 Bedrock 数据自动化功能页面、Amazon Bedrock 定价页面,或查看文档。