使用 Amazon Transcribe
创建音频转录
在本分步教程中,您将学习如何在 AWS 管理控制台中使用 Amazon Transcribe 创建录音文件的文本转录。Amazon Transcribe 是一项自动语音识别 (ASR) 服务,使开发人员能够轻松地为其应用程序添加语音转文本功能。通过使用 Amazon Transcribe API,您可以分析 Amazon Simple Storage Service (S3) 中存储的音频文件,并让该服务返回转录后的语音文本文件。
作为开发人员,创建客户服务通话的文本转录或为音频和视频内容生成字幕都是需要用到语音转文本功能的常见挑战。您可以通过从头开始构建机器学习模型来解决这一挑战。但是,这种方式既耗时又昂贵,且需要精通机器学习专业知识。如果不想如此麻烦,您可以使用 Amazon Transcribe,这是一项经过预先训练的完全托管式服务,可以提供快速、高质量的转录。
在本教程中,您需要下载一个示例音频文件并创建一个 S3 存储桶,然后将音频文件上传到存储桶中。然后,您将在 AWS 管理控制台中使用 Amazon Transcribe 创建示例音频片段的转录。
本教程演示了在使用 AWS CLI 或 Transcribe API 时可用的功能。对于生产或概念验证实现,我们建议使用这些编程接口,而不是 Amazon Transcribe 控制台。
使用此教程需要拥有 AWS 账户
Amazon Transcribe 免费套餐很容易入门。免费套餐提供每月最多 60 分钟的音频转录额度,并且在您创建 AWS 账户后的 12 个月内免费。
第 1 步:创建 S3 存储桶并上传示例音频文件
在此步骤中,您需要下载示例音频文件并创建一个 S3 存储桶,然后将示例文件上传到 S3 存储桶。Transcribe 仅通过 S3 存储桶来访问要转录的音频和视频文件。
a. 单击此处下载示例音频文件,本教程的后续步骤中会对此文件进行转录。文件名为 transcribe-sample.mp3。
b. 单击此处之后,AWS 管理控制台将在新的浏览器窗口中打开,因此您可以使本分步指南保持打开状态。此屏幕加载后,请输入您的用户名和密码以便开始操作。单击区域下拉菜单,选择提供 Amazon Transcribe 的区域。
截至撰写本文时,Amazon Transcribe 的可用区域包括:美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(俄勒冈)、亚太地区(悉尼)、加拿大(中部)和欧洲(爱尔兰)。
e. 请输入一个唯一的存储桶名称。存储桶名称必须不同于 Amazon S3 中的所有现有存储桶名称。此外,还要遵守一些其他关于 S3 存储桶名称的限制。然后选择要在其中创建存储桶的区域。
选择下一步。
第 2 步:创建转录作业
在此步骤中,您将使用 Amazon Transcribe 控制台创建并运行转录作业。
第 3 步:查看转录结果
在此步骤中,您将学习如何检查进度并查看转录作业的结果。
第 4 步:终止资源
在此步骤中,您将从 S3 存储桶中删除示例文件,以免承担不必要的费用。
恭喜!
在本教程中,您了解到 Amazon Transcribe 能够成规模地将语音转为文本。通过使用 Amazon Transcribe,您可以处理各种音频或视频文件,例如客户服务通话、商务会议、广播电视和点播视频。