Amazon Bedrock 数据自动化现已支持自定义词汇表
发布于:
2026年4月3日
Amazon Bedrock 数据自动化 (BDA) 功能现在通过名为“数据自动化库”的新功能支持自定义词汇表,使您在处理音频和视频内容时,能够提高特定领域术语的语音识别和转录准确度。BDA 可自动从非结构化多模态内容(例如文档、图像、音频和视频)中为生成式 AI 驱动的应用程序生成见解。这项新功能专为医疗保健、法律、金融服务、媒体和联络中心分析领域等需要准确识别专业术语的组织而设计。
借助自定义词汇表,您可以向 BDA 提供特定领域的词汇和短语列表,包括品牌名称、首字母缩略词、医学术语和技术术语,以便从您的内容中准确识别并提取这些术语。您还可以指定显示形式以控制识别的术语在输出中的显示方式,例如将“electrocardiogram”显示为“ECG”,或将“discounted cash flow”显示为“DCF”。例如,负责处理医患对话的医疗保健公司可以提供疾病和药物名称清单;联络中心分析提供商可以提供保险、电信和公共部门等垂直领域的行业特定术语,以确保转录的准确性。自定义词汇表支持 11 种语言,包括英语、西班牙语、法语、德语、意大利语、葡萄牙语、日语、韩语和中文(简体、繁体和广东话),且不收取额外费用。
包含自定义词汇表功能的数据自动化库现已在美国东部(弗吉尼亚州北部)、美国西部(俄勒冈州)、欧洲地区(爱尔兰)、欧洲地区(伦敦)、欧洲地区(法兰克福)、亚太地区(孟买)和亚太地区(悉尼)提供。要了解更多信息,请访问 Bedrock 数据自动化页面或查看 Bedrock 数据自动化用户指南。