发布于: Dec 7, 2022

今天,我们很高兴地宣布,Amazon Transcribe 自定义语言模型 (CLM) 现在支持批处理和流式处理模式下的德语和日语。Amazon Transcribe 是一项自动语音识别 (ASR) 服务,使您能够轻松地为应用程序添加语音转文本功能。CLM 允许您使用预先存在的数据为您的特定批处理和流式转录用例构建自定义语音引擎。无需具备机器学习经验即可创建 CLM。

CLM 使用您已拥有的文本数据,例如网站内容、说明手册以及其他覆盖您的领域的独特词典和词汇表的资产。上传您的训练数据集以创建 CLM 并使用新 CLM 运行转录作业。Amazon Transcribe CLM 适用于在法律、金融、酒店、保险和媒体等不同领域开展业务的客户。CLM 旨在提高特定领域语音的转录准确性。这包括您在正常日常对话中所听到内容之外的任何内容。例如,如果您正在转录科学会议的会议记录,标准转录不太可能识别主讲人使用的许多科学术语。通过使用 Amazon Transcribe CLM,您可以训练自定义语言模型来识别您的学科中所使用的专业术语。

CLM 现在支持利用德语和日语进行批处理和流式转录,并且在 Amazon Transcribe 运营的所有 AWS 区域都可用。要开始构建您自己的自定义语音识别模型,请登录 Amazon Transcribe 服务控制台。有关 CLM 功能的更多详细信息,请访问“构建自定义语言模型以提高 Amazon Transcribe 的语音转文本性能”一文。您可以通过查看 Amazon Transcribe 文档页面了解更多信息。