AWS 商业应用程序
-
Amazon Polly - 将文本转换为逼真的语音
-
Amazon Transcribe - 自动将语音转换为文本
-
Amazon Polly - 将文本转换为逼真的语音
-
Amazon Polly
将文本转换为逼真的语音12 个月免费,支持包括中、英、西、法、德、日、韩等 30 种语言及语音,每月免费 5GB 存储空间
Amazon Polly 是一种将文本转换为逼真语音的服务,它允许您创建能够说话的应用程序,并构建全新类别的支持语音功能的产品。Polly 的文本转语音 (TTS) 服务使用高级深度学习技术来合成听起来像自然人类语言的语音。Amazon Polly 提供众多语言的几十种逼真语音,您可以构建适用于许多不同国家/地区的具有语音功能的应用程序。
除了标准 TTS 语音外,Amazon Polly 还提供神经文本转语音 (NTTS) 声音,通过全新的机器学习方法提高语音质量。Polly 的神经 TTS 技术还支持新闻主播说话风格,这是针对新闻叙述用例量身定制。
最后,Amazon Polly 的“品牌之声”功能可以为组织打造定制语音。这是一个定制项目,您将与 Amazon Polly 团队合作,为您的组织量身打造专属 NTTS 语音。单击此处了解更多信息。
好处
自然声音
Amazon Polly 可以提供几十种语言,以及各种发音纯正的男声和女声。Amazon Polly 可以流畅阅读文本,使您可以向全球用户提供高质量的语音输出。
存储和重放语音
Amazon Polly 使您可以无限次重放生成的语音,而不会产生任何额外费用。您可以创建标准格式(如 MP3 和 OGG)的语音文件,并将它们存储在应用程序或设备和的云服务或本地中,以便在离线时重放。
实时响应
要提供逼真声音和对话式用户体验,必须具有一贯的快速响应时间。当您向 Amazon Polly 的 API 发送了文本,它也可以将音频作为流返回到您的应用程序中,以便您可以立即播放语音。
定制和控制语音输出
按照您的需求对 Amazon Polly 语音进行修改 – Amazon Polly 支持词典和 SSML 标记,使您能够从多方面控制语音,例如发音、音量、基频、语速等等。
成本低廉
Amazon Polly 采用即付即用定价,每字符转换成本低廉,并且可以无限次重放,使您能够在您的应用程序中实现经济高效的语音合成。
简单易用的 API
Amazon Polly 提供一个 API,借助此 API,您可以将语音合成快速集成到应用程序中。您只需将要转换成语音的文本发送到 Amazon Polly API,Amazon Polly 便会立即将音频流返回到您的应用程序中。您的应用程序可以直接开始对音频进行流式处理,并且您也可以将其存储为 MP3 等标准音频文件格式。
定价示例
示例 文本长度 语音时长 标准 TTS 成本 神经 TTS 成本 1000 个请求,每个请求 1000 个字符 100 万个字符 约 23 小时 8 分钟
26.00 元
104.00 元
普通新闻文章
约 6500 个字符,3 页 约 9 分钟
0.20 元
0.65 元 马克·吐温的《哈克贝利·费恩历险记》
约 600000 个字符,224 页 约 13 小时 50 分钟
15.60 元 62.40 元
* 汇率按 1:6.5
语言 语音(女性) 语音(男性) 示例文本
英语 你好Do you speak a foreign language? One language is never enough. 巴西葡萄牙语 Vitória Ricardo Oi.Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante. 丹麦语 Naja Mads Hej.Taler du et fremmed sprog? Et sprog er aldrig nok. 法语 Léa Mathieu Bonjour.Parlez-vous une autre langue que le français? Une langue n'est jamais assez. 日语 Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。 韩语 Seoyeon(标准)
Seoyeon (Neural)안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다. 中文普通话 知语 你好,你会不会说其他外语?只会一种语言是不够的。 西班牙语 Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente. 使用案例
内容创建
音频可作为书面和/或视觉交流的补充性媒体。为您的内容添加语音,您可以为您的用户提供另一种接收信息的方式,并满足了更广泛阅读群体的需要。Amazon Polly 能够生成几十种语言的语音,使得向面向全球用户的应用程序添加语音变得简单易行,例如 RSS 信息流、网站或视频。
示例:将一篇文章转换为语音,并下载为 MP3 格式“借助 Amazon Polly,GoAnimate 用户可立即为他们使用我们的平台制作出的动画人物提供声音。当没有足够的资源或时间来提供实时画外音时,如制作使用多种语言的视频或者在前期制作期间想加快审批流程时,Amazon Polly 尤为有用。语音可与我们丰富的前期动画资源集无缝集成,这增强了 GoAnimate 的易用性,并提高了我们客户的效率和上市速度。”
– Alvin Hung,GoAnimate 首席执行官兼创始人
在线学习
Amazon Polly 让开发人员能够在应用程序中提供增强的视觉体验,例如语音同步面部动画或者卡拉 ok 式文字突出提示。Amazon Polly 让用户可以轻松请求额外的元数据流,其中带有与语句、文字或声音的发出时间相关的信息。将这一元数据流与合成语音音频流配合使用,客户可以在应用程序中让头像具有动画效果,并突出显示当前说到的文字。
示例:播放语音并突出显示说到的文字“我没法举出很多使用案例来证明发音准确比何时学习新语言更重要。我们发现,Amazon Polly 声音的质量很高,而且对于教授语言来说,这些声音与自然人类语言的教授效果一样好。”
– Severin Hacker,Duolingo 首席技术官
电话语音
借助 Amazon Polly,您的客户联系中心可以使用自然的声音与客户互动。您可以缓存并重放 Amazon Polly 的语音输出,以便在交互式语音应答(IVR)系统中对来电客户进行语音提示,例如 Amazon Connect 。此外,您可以使用 Amazon Polly API 提供自动实时信息,如服务状态、账户和账单查询、地址和联系信息。
例如:电话语音应答系统的文本转语音“Bandwidth 构建了一款由 Amazon Polly 提供支持的小型、可靠且快速的 TTS 应用程序。我们现在可以低成本使用优质的语音。开发人员构建这项新服务的工作量出人意料地少之又少。”
– Yiannis Philipopoulos,高级软件开发人员,带宽
-
Amazon Transcribe - 自动将语音转换为文本
-
Amazon Transcribe
自动将语音转换为文本,字幕(SRT&VTT)12 个月免费,支持包括中、英、西、法、德、日、韩等 37 种世界常用语言
Amazon Transcribe 可让开发人员轻松地为其应用程序添加语音转文本功能。搜索和分析音频数据对于计算机而言几无可能。因此,需要先将录制的语音转换成文本,然后再将文本用于应用程序中。以往,客户不得不与转录提供商合作。提供商会要求客户签署昂贵的合同,同时也难以集成到客户的技术堆栈中以完成转录任务。许多提供商都使用过时的技术,无法很好地适应不同的情况(例如联络中心常见的低保真度通话录音),从而导致转录准确性较差。
Amazon Transcribe 使用一种称为自动语音识别 (ASR) 的深度学习过程,快速准确地将语音转换为文本。 Amazon Transcribe 可用于转录客户服务电话、自动添加对白字幕,以及为媒体资产生成元数据以创建完全可搜索的存档。您可以使用 Amazon Transcribe Medical 将医疗语音转文本功能添加到临床文档应用程序。
优势
解锁音频和视频内容的价值
搜索和分析音频数据对于计算机而言几无可能。通过 Amazon Transcribe 能够轻松地将录制的语音转换成文字,并将这些功能集成到应用程序和下游任务中。 Transcribe 可应用于实时音频和视频流或广播内容,以实时添加字幕或转录。
转变客户体验
您可以通过 Transcribe 的优化模型进行通话转录、实时视频添加字幕和临床存档,以转变客户体验。Amazon Transcribe 呼叫分析和 AWS Contact Center Intelligence 解决方案更进一步,可供您从客户对话中提取观点。
使用案例
呼叫分析和座席协助
通过 Transcribe 呼叫分析,您可以快速地从客户对话中提取可实施的观点。您可以使用来自 AWS Contact Center Intelligence 合作伙伴或 Contact Lens for Amazon Connect 的整套解决方案改善客户参与度、提高座席生产效率,并向主管提供质量管理警报。
媒体内容搜索和添加字幕
内容制作者和媒体分发者可以使用 Amazon Transcribe 将音频和视频资产自动转换为完全可搜索的存档,以便实现突出显示生成、内容审核和盈利。另外,利用 Transcribe 和 Amazon Translate 生成本地化的字幕以提高内容的到达率和可访问性。
会议字幕
提高生产效率并使用 Amazon Transcribe 作为数字抄写员来准确地对您有意义的会议和对话内容。 这还可以提高可访问性,并通过实时提交的注释将所有人员记录在同一页上。
临床文档
医生和医疗从业者可以使用 Amazon Transcribe Medical 快速高效地将临床对话记录到电子病历 (EHR) 系统中进行分析。该服务符合 HIPAA 要求,并经过了训练,了解医学术语。通过 Transcribe Medical 改善患者结果。
客户案例
Intuit 使用 Contact Lens for Amazon Connect(由 Amazon Transcribe 和 Amazon Comprehend 支持)分析和改进客户对话。
NASCAR 选择 Amazon Transcribe 为其视频点播内容自动添加字幕,与最初估计的工作量相比减少了 97%。
通过 Amazon Transcribe,Audioburst 每天可分析 225,000 分钟的实时电台访谈内容,以产生新一代体验并促进参与。
博客
作者:Deenadayaalan Thirugnanasambandam、Revanth Anireddy、Loc Trinh、Paul Zhao 和 Piyush Patel作者:Scott Seyfarth 和 Paul Zhao
作者:Simran Baxendale、Alex Chirayath 和 Shivani Mehendarge请访问 Transcribe 博客,了解独特的使用案例、最佳实践、技术深入研究和新功能发布。