Amazon Polly 入门

Amazon Polly 是一种将文本转换为逼真语音的服务,借助该服务,您可以创建能够说话的应用程序,并构建全新的支持语音功能的产品。Amazon Polly 是一种文本转语音服务,它使用高级深度学习技术来合成很像人声的语音。

Amazon Polly 可以提供众多语言的几十种逼真语音,因此您可以选择最合适的语音,构建适用于许多不同国家/地区的具有语音功能的应用程序。

语言 女性 男性 示例文本
英语 Joanna Matthew Hello.Do you speak a foreign language?One language is never enough.
丹麦语 Naja Mads Hej.Taler du et fremmed sprog?Et sprog er aldrig nok.
巴西葡萄牙语 Vitória Ricardo Oi.Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
西班牙语 Penélope Miguel Hola.¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
日语 Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
韩语 Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。

此处查看 Amazon Polly 语音及支持的语言的完整列表。


日期

标题

作者

2017 年 11 月 9 日 Modify the Timbre of Amazon Polly Voices with the New Vocal Tract SSML Feature Robin Dautricourt,Amazon Polly 方向的高级产品经理

2017 年 10 月 19 日

Convert Your Text into an MP3 File with Amazon Polly and a Simple Python Script Dzidas Martinaitis,AWS 数据科学家

2017 年 10 月 12 日

Amazon Polly Expands to the Asia Pacific (Tokyo) Region and Adds Two New Voices Robin Dautricourt,Amazon Polly 方向的高级产品经理

2017 年 9 月 29 日

Using Amazon Polly to Provide Real-Time Home Monitoring Alerts Siva K. Syamala,Y-Cam 解决方案高级开发人员
2017 年 8 月 30 日 How Amazon Polly Breathed Life into Dan Brown’s Digital Assistant Damian Dutton,Beeliked 首席执行官兼创始人

在此阅读所有 Amazon Polly 相关的 AI 博客文章。


声音自然

声音自然

Amazon Polly 可以提供几十种种逼真的语音并支持多种语言,其中包括各种口音的多种男声和女声。Amazon Polly 可以流畅地读出多种语言的文本,这使您可以交付高质量语音输出并构建面向全球用户的应用程序。

易于集成

易于集成

Amazon Polly 让您能够轻松地为网站、移动应用程序或设备添加声音。借助 Amazon Polly,您只需把想要将其转换为语音的文本写入 Amazon Polly API,然后 Amazon Polly 便会立即返回音频流。不同于需要繁琐的审批流程的其他解决方案,Amazon Polly 并不要求您说明将如何在应用程序中使用 Amazon Polly 的语音,且您无需签订任何分发协议便可立即开始使用。

存储和重新分发语音

存储和重新分发语音

在您每次重放其他解决方案之前生成的音频时,您必须拥有特权或支付相应费用,但 Amazon Polly 允许您无限次重放,且不会收取任何额外费用。这种免费重放功能还可延伸至离线使用的情况。您可以创建多种标准格式 (如 MP3 和 OGG) 的语音文件,并将它们存储在手机等设备和物联网 (IoT) 设备上,以便在离线时重放。

 

费用低廉

费用低廉

Amazon Polly 采用按需付费的定价模式,每字符转换费用非常低廉,且支持无限次重放,这为您提供了一种经济高效的方式,使您能够在几乎任何应用程序中实现语音合成。

快速响应

快速响应

要提供逼真声音和对话式用户体验,必须具有一致且快速的响应时间。具有语音功能的应用程序需要能够在无任何延迟的情况下播放合成语音。不妨思考一下提供语音导航方向的应用程序、为学生提供言语指导的应用程序以及通过实时对话与用户互动的应用程序。当这类应用程序可以在对话流中立即作出响应,而不会出现可感知到的延迟时,才最为有效。即使您向 Amazon Polly API 发送了冗长的文本,它也可以将音频作为流返回到您的应用程序中,以便您可以立即播放语音。要提供这种动态的语音响应功能,仅靠通常存储在用户设备上的可用语音音频远远不够,您需要能够访问大量语音音频。Amazon Polly 位于云中,因此您可以访问各种合成语音。借助 Amazon Polly,您的应用程序可提供更多包含实时数据的有价值响应。

Amazon Polly 让您能够轻松地为视频、演示文稿或在线培训课程添加语音。Amazon Polly 可以生成 24 种语言的语音,让您能够轻松地为具有全球受众的应用程序添加语音。借助 Amazon Polly,您可以阅读 RSS 源、新闻或电子邮件,并将合成语音存储为音频文件形式。

创建内容
GoAnimate

“借助 Amazon Polly,GoAnimate 用户可立即为他们使用我们的平台制作出的动画人物提供声音。当没有足够的资源或时间来提供实时画外音时,如制作使用多种语言的视频或者在前期制作期间想加快审批流程时,Amazon Polly 尤为有用。语音可与我们丰富的前期动画资源集无缝集成,这增强了 GoAnimate 的易用性,并提高了我们客户的效率和上市速度。”

– Alvin Hung,GoAnimate 首席执行官兼创始人


Amazon Polly 让开发人员能够在应用程序中提供增强的视觉体验,例如语音同步面部动画或者卡拉 ok 式文字突出提示。Amazon Polly 让用户可以轻松请求额外的元数据流,其中带有与语句、文字或声音的发出时间相关的信息。将这一元数据流与合成语音音频流配合使用,客户可以在应用程序中让头像具有动画效果,并突出显示当前说到的文字。

创建内容

“我们努力让基于云技术的课堂对所有人来说都更加有趣和有效,包括有读写障碍的用户。Amazon Polly 将高质量文本转语音的声音与我们的 AppWriter 产品系列集成,提高了我们的学习平台的性能。”在读出文字的同时看到实时突出显示的文字,这一点对我们的用户至关重要。利用 Polly 的语音标记功能,AppWriter 可以提供增强的阅读体验,为读写有困难的用户带来了极大的便利。”

- Stefan Pal,Wizkids 首席运营官


借助 Amazon Polly,您的客户联系中心可以通过自然的声音进行回复。您可以通过交互式语音应答 (IVR) 系统重放 Amazon Polly 的语音输出。此外,您可以使用 Amazon Polly API 自动提供实时信息,如服务状态、账户和账单问询、地址和联系信息。

客户联系中心

“Bandwidth 构建了一款由 Amazon Polly 提供支持的小型、可靠且快速的 TTS 应用程序。我们现在可以低成本使用优质的语音。开发人员构建这项新服务的工作量出人意料地少之又少。”

– Yiannis Philipopoulos,Bandwidth 高级软件开发人员


Amazon Polly 让您能够以低廉的成本轻松地为 IoT 设备添加语音,从而为新的物联网 (IoT) 使用案例提供支持。IoT 设备可使用语音提供自然的应答和通知,从而提高应用程序的可访问性,并使用户无需依赖于屏幕即可获取信息。借助 Amazon Polly,您可以生成语音文件并将它们存储在设备上,以便在离线时重放。

您可以使用 AWS Lambda 根据来自 AWS IoT 规则引擎的事件生成预先签署的 Polly URL,然后使用设备网关将这些 URL 发送到您的 IoT 设备,以便它们请求逼真语音。

物联网 (IoT)

“我们的研究表明,如果语音听起来很机械化 (像市场上的许多非 AWS 服务那样),现在的客户就不太愿意购买这个语音辅助智能安全解决方案。我们的客户喜欢 Amazon Polly 的语音听起来像真人一样。事实上,许多人以为是真人语音。”

– Devin Chawda,Y-Cam 解决方案首席执行官


Amazon Polly 可用于提高教人们如何说新语言的应用程序的可用性。例如,最终用户可在您的应用程序中键入外语短语,然后听母语人士如何说这个短语。Amazon Polly 支持 24 种语言,为教师和学生提供了很多选择。

语言学习
Duolingo

“我没法举出很多使用案例来证明发音准确比何时学习新语言更重要。我们发现,Amazon Polly 声音的质量很高,而且对于教授语言来说,这些声音与自然人类语言的教授效果一样好。”

– Severin Hacker,Duolingo 首席技术官


借助 Amazon Polly,您可以为视障人士创建和分发合成语音形式的无障碍信息。通过这种方法,您可以帮助有视觉障碍的人士获取各种内容,如新闻、图书或电子邮件消息。

英国皇家盲人协会

“我们目前使用 Amazon 的语音转文本技术来为众多 B2B 和 B2C 客户 (包括公用事业公司、金融机构、媒体公司),创建和分发合成音频内容形式的无障碍信息以及其他面向客户的材料 (如杂志和出版物)。随着 Amazon Polly 的推出,我们很高兴能够通过提供令人难以置信的逼真声音来吸引受众并与之互动,从而为这些客户提供更好的体验。”

– John Worsfold,英国皇家盲人协会解决方案实施经理

Amazon Polly 非常容易上手。只需登录控制台,然后单击几次即可开始将您自己的文本生成语音。

开始使用