Amazon Polly 是一项将文本转换为逼真语音的服务。Amazon Polly 可以提供几十种逼真的语音并支持多种语言,因此您可以选择最合适的语音,并在多个国家/地区分发具有语音功能的应用程序。借助 Amazon Polly,您只需将要转换成语音的文本发送到 Amazon Polly API,Amazon Polly 便会立即将音频流返回到您的应用程序中,以便您直接播放音频或将其存储为 MP3 等标准音频文件格式。

试用 Amazon Polly

注册一个免费账户
或登录到控制台

Amazon Polly 免费套餐在前 12 个月内,每月可用 500 万个字符,从第一次发言请求开始计算。

查看 AWS 免费套餐详细信息 »

Amazon Polly 提供一个 API,借助此 API,您可以将语音合成快速集成到应用程序中。您只需将要转换成语音的文本发送到 Amazon Polly API,Amazon Polly 便会立即将音频流返回到您的应用程序中。您的应用程序可以直接开始对音频进行流式处理,并且您也可以将其存储为 MP3 等标准音频文件格式。

采样率 示例代码
"Hi. My name is Joanna." from boto3 import client
polly = client("polly", region_name="us-east-1")
response = polly.synthesize_speech(
        Text="Hi. My name is Joanna.",
        OutputFormat="mp3",
        VoiceId="Joanna")

Amazon Polly 可以提供几十种逼真的语音并支持多种语言,因此您可以选择最合适的语音,并在多个国家/地区分发具有语音功能的应用程序。

语言
澳大利亚英语 Nicole Russell
巴西葡萄牙语 Vitória Ricardo
加拿大法语 Chantal  
丹麦语 Naja Mads
荷兰语 Lotte Ruben
法语 Céline Mathieu
德语 Vicki Hans
  Marlene  
冰岛语 Dóra Karl
印度英语 Raveena  
  Aditi  
意大利语 Carla Giorgio
日语 Mizuki Takumi
韩语 Seoyeon  
挪威语 Liv  
波兰语 Ewa Jacek
  Maja Jan
葡萄牙语 – 伊比利亚语 Inês Cristiano
罗马尼亚语 Carmen  
俄语 Tatyana Maxim
西班牙语 – 卡斯提语 Conchita Enrique
瑞典语 Astrid  
土耳其语 Filiz  
英国英语 Amy Brian
  Emma  
美国英语 Joanna Matthew
  Salli Justin
  Kendra Joey
  Kimberly  
  Ivy  
美国西班牙语 Penélope Miguel
威尔士语 Gwyneth  
威尔士英语   Geraint

Amazon Polly 让用户可以轻松请求额外的元数据流,其中带有与语句、文字或声音的发出时间相关的信息。将这一元数据流与合成语音音频流配合使用,您现在能够在应用程序中提供增强的视觉体验,例如语音同步面部动画或者卡拉 ok 式文字突出提示。

请参阅本文档以便了解有关如何使用语音标记的更多信息。

借助 Amazon Polly,您可以通过应用程序近乎实时地将各种信息流式传输给用户。您还可以从各种采样率中进行选择,从而为应用程序优化带宽和音频质量。Amazon Polly 支持 MP3、Vorbis 和原始 PCM 音频流格式。

采样率 MP3 大小 OGG 大小
PCM 大小
22.05kHz 收听
19.02kB 19.14kB 不适用
16.05kHz 收听 16.04kB
16.35kB
99.53kB
8.00kHz 收听 13.26kB 10.40kB 49.76kB

Amazon Polly 支持语音合成标记语言 (SSML),它是一种基于 XML 的 W3C 标准标记语言,适用于语音合成应用程序,且支持使用通用 SSML 标签进行断句、重音和语调。这种灵活性能够帮助您创建逼真的语音,从而吸引并维持听众的注意力。

要了解更多信息,请参阅关于 SSML 标签的 Amazon Polly 文档

示例 SSML
这是我平时的说话方式 (无)
我能用较高的音调说话,也能用较低的音调说话。 我能用 较高的音调说话 ,也能用 较低的音调说话
我可以说得很慢,也可以说得很快 我可以说得 很慢 ,也可以说得 很快
我还能大声说,也能小声说 我还能 大声说 ,也能 小声说
我能小声说话。 我有个秘密要小声告诉你。 ' 我不是人类。 你信不信?

Amazon Polly 支持 AWS 软件开发工具包 (Java、Node.js、.NET、PHP、Python、Ruby、Go 和 C++) 和 AWS 移动软件开发工具包 (iOS/Android) 中包含的所有编程语言。Polly 还支持 HTTP API,以便您可以实施自己的访问层。

Amazon Polly 可通过 Polly API (和各种采用特定语言的软件开发工具包)、AWS 管理控制台和 AWS 命令行界面 (CLI) 进行访问。不论您是通过控制台、API 还是 CLI 使用 Amazon Polly,您都可以全面控制它的各项功能。

借助 Amazon Polly 的自定义词典或词汇,您可以修改特定词语的发音,如公司名称、首字母缩略词、外来词和新词 (例如,使用非法语语音说话时的“ROTFL”、“C’est la vie”)。要自定义这些发音,您需要上传包含词条的 XML 文件。例如,您可以使用以下 XML 提供一个音位,从而自定义“Nguyen”的发音。


            Nguyen
            nguyen
            NGUYEN
            "nu.jEn'