使用 Amazon Transcribe

创建音频转录

在本分步教程中,您将学习如何在 AWS 管理控制台中使用 Amazon Transcribe 创建录音文件的文本转录。Amazon Transcribe 是一项自动语音识别 (ASR) 服务,使开发人员能够轻松地为其应用程序添加语音转文本功能。通过使用 Amazon Transcribe API,您可以分析 Amazon Simple Storage Service (S3) 中存储的音频文件,并让该服务返回转录后的语音文本文件。

作为开发人员,创建客户服务通话的文本转录或为音频和视频内容生成字幕都是需要用到语音转文本功能的常见挑战。您可以通过从头开始构建机器学习模型来解决这一挑战。但是,这种方式既耗时又昂贵,且需要精通机器学习专业知识。如果不想如此麻烦,您可以使用 Amazon Transcribe,这是一项经过预先训练的完全托管式服务,可以提供快速、高质量的转录。

在本教程中,您需要下载一个示例音频文件并创建一个 S3 存储桶,然后将音频文件上传到存储桶中。然后,您将在 AWS 管理控制台中使用 Amazon Transcribe 创建示例音频片段的转录。

本教程演示了在使用 AWS CLI 或 Transcribe API 时可用的功能。对于生产或概念验证实现,我们建议使用这些编程接口,而不是 Amazon Transcribe 控制台。

使用此教程需要拥有 AWS 账户

Amazon Transcribe 免费套餐很容易入门。免费套餐提供每月最多 60 分钟的音频转录额度,并且在您创建 AWS 账户后的 12 个月内免费。

详细了解免费套餐 >>


第 1 步:创建 S3 存储桶并上传示例音频文件

在此步骤中,您需要下载示例音频文件并创建一个 S3 存储桶,然后将示例文件上传到 S3 存储桶。Transcribe 仅通过 S3 存储桶来访问要转录的音频和视频文件。


a.  单击此处下载示例音频文件,本教程的后续步骤中会对此文件进行转录。文件名为 transcribe-sample.mp3


b.  单击此处之后,AWS 管理控制台将在新的浏览器窗口中打开,因此您可以使本分步指南保持打开状态。此屏幕加载后,请输入您的用户名和密码以便开始操作。单击区域下拉菜单,选择提供 Amazon Transcribe 的区域。

截至撰写本文时,Amazon Transcribe 的可用区域包括:美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(俄勒冈)、亚太地区(悉尼)、加拿大(中部)和欧洲(爱尔兰)。

create-audio-transcript-transcribe-step-1b
create-audio-transcript-transcribe-step-1b

(单击可放大)


c.在搜索栏中键入 S3,然后选择 S3 打开控制台。

create-audio-transcript-transcribe-step-1c
create-audio-transcript-transcribe-step-1c

(单击可放大)


d.  在 S3 控制面板中,选择创建存储桶

如果您是初次创建存储桶,则会看到类似此处所示图片的屏幕。

如果您已创建 S3 存储桶,S3 控制面板将会列出您创建的所有存储桶。

create-audio-transcript-transcribe-step-1d
create-audio-transcript-transcribe-step-1d

(单击可放大)


e.  请输入一个唯一的存储桶名称。存储桶名称必须不同于 Amazon S3 中的所有现有存储桶名称。此外,还要遵守一些其他关于 S3 存储桶名称的限制。然后选择要在其中创建存储桶的区域。

选择下一步

create-audio-transcript-transcribe-step-1e
create-audio-transcript-transcribe-step-1e

(单击可放大)


f.  关于 S3 存储桶,控制台提供了很多有用选项,包括版本控制服务器访问日志记录标签对象级日志记录默认加密。在本教程中,我们将不启用这些功能。

选择下一步

create-audio-transcript-transcribe-step-1f
create-audio-transcript-transcribe-step-1f

(单击可放大)


g.  在此步骤中,您可以在 S3 存储桶创建过程中调整 S3 存储桶的权限设置。

保留默认值,然后选择下一步

create-audio-transcript-transcribe-step-1g
create-audio-transcript-transcribe-step-1g

(单击可放大)


h.  检查您的配置设置,然后选择创建存储桶

create-audio-transcript-transcribe-step-1h
create-audio-transcript-transcribe-step-1h

(单击可放大)


i.  您将在 S3 控制台中看到新的存储桶。单击存储桶的名称以转至相应存储桶。您看到的存储桶名称将不同于右侧屏幕截图中的名称。

create-audio-transcript-transcribe-step-1i
create-audio-transcript-transcribe-step-1i

(单击可放大)


j. 您现在位于存储桶主页上。

选择上传

create-audio-transcript-transcribe-step-1j
create-audio-transcript-transcribe-step-1j

(单击可放大)


k.  要上传 transcribe-sample.mp3 文件,您可以选择添加文件并选择该文件,或者将 transcribe-sample.mp3 文件拖到上传框。

选择上传

create-audio-transcript-transcribe-step-1k
create-audio-transcript-transcribe-step-1k

(单击可放大)


l.  在存储桶中,选中 transcribe-sample.mp3 文件旁边的复选框。您会看到 transcribe-sample.mp3 文件的文件详细信息窗格。请将此链接复制并保存到文件中,本教程稍后将用到它。

create-audio-transcript-transcribe-step-1l
create-audio-transcript-transcribe-step-1l

(单击可放大)


第 2 步:创建转录作业

在此步骤中,您将使用 Amazon Transcribe 控制台创建并运行转录作业。


a.  在顶部菜单栏中,选择服务,在搜索栏中键入 Transcribe,然后选择 Amazon Transcribe 打开服务控制台。

create-audio-transcript-transcribe-step-2a
create-audio-transcript-transcribe-step-2a

(单击可放大)


b.  在 Amazon Transcribe 控制台主页上,打开导航窗格,然后单击转录作业

c.在转录作业页上,单击创建作业

create-audio-transcript-transcribe-step-2b
create-audio-transcript-transcribe-step-2b

(单击可放大)


d.  在创建转录作业页上的名称字段中,键入 sample-transcription-job

保留默认的语言设置,即英语

输入 S3 上的文件位置字段中,粘贴 S3 存储桶中的示例文件链接。您的示例文件链接将不同于右侧屏幕截图中的链接。 

保留默认的格式设置,即 mp3

您可以使用自定义词汇表功能来帮助 Amazon Translate 识别您的应用程序中专用的单词和短语,例如像 Etienne 这样的非英语名称。本教程中不会使用此功能。

create-audio-transcript-transcribe-step-2c
create-audio-transcript-transcribe-step-2c

(单击可放大)


e.  保留默认的数据位置设置,即 Amazon 默认

如果启用声道识别,Amazon Transcribe 在处理音频时能够将每个讲话者记录在不同的声道上,并生成带有声道标签注释的单个转录。

如果启用讲话者识别,Amazon Transcribe 能够识别出讲话者的变化,并相应地确定转录文本归属于哪个讲话者。

本教程中不使用这些选项。

选择创建开始您的转录作业。 

create-audio-transcript-transcribe-step-2d
create-audio-transcript-transcribe-step-2d

(单击可放大)


第 3 步:查看转录结果

在此步骤中,您将学习如何检查进度并查看转录作业的结果。


a.  单击创建按钮后,您会转到转录作业屏幕。屏幕上将显示 sample-transcription-job 的状态。状态包括进行中完成失败

状态为完成时,单击名称列中的 sample-transcription-job 链接查看转录结果。

create-audio-transcript-transcribe-step-3a
create-audio-transcript-transcribe-step-3a

(单击可放大)


b.   接下来,您会看到 sample-transcription-job 的详细信息。向下滚动到转录面板以查看转录作业的输出。在 JSON 窗格中,您可以查看从 Transcribe API 或 AWS CLI 返回的转录结果。

create-audio-transcript-transcribe-step-3b
create-audio-transcript-transcribe-step-3b

(单击可放大)


第 4 步:终止资源

在此步骤中,您将从 S3 存储桶中删除示例文件,以免承担不必要的费用。


a.  在上方的导航菜单中,单击服务,在搜索栏中键入 S3,然后选择 S3 打开控制台。

create-audio-transcript-transcribe-step-4a
create-audio-transcript-transcribe-step-4a

(单击可放大)


b.  滚动浏览 S3 存储桶,找到在本教程先前步骤中创建的存储桶。单击存储桶名称以查看存储桶的内容。您看到的存储桶名称将不同于右侧屏幕截图中的名称。

create-audio-transcript-transcribe-step-4b
create-audio-transcript-transcribe-step-4b

(单击可放大)


c.  选择存储桶中包含的 transcribe-sample.mp3 文件,然后从操作菜单中选择删除。确认删除。

create-audio-transcript-transcribe-step-4c
create-audio-transcript-transcribe-step-4c

(单击可放大)


恭喜!

在本教程中,您了解到 Amazon Transcribe 能够成规模地将语音转为文本。通过使用 Amazon Transcribe,您可以处理各种音频或视频文件,例如客户服务通话、商务会议、广播电视和点播视频。

 

学习成规模地翻译文本

这个 10 分钟的教程将向您介绍如何使用 Amazon Translate 将已经转录的文本翻译成其他语言。

Transcribe API 和 CLI 入门

文档内的这个教程中学习如何使用 Amazon Transcribe API 和 CLI。

探索 Amazon Comprehend

这个 10 分钟的教程将向您介绍如何使用 Amazon Comprehend 分析文本中的情感。

 


本教程对您是否有帮助?