Amazon Polly - AI 语音生成器

配置数十种语言的高质量自然人声

什么是 Amazon Polly?

Amazon Polly 是一项完全托管的服务,可按需生成语音,将任何文本转换为音频流。使用深度学习技术转换文章、网页、PDF 文档和其他文本转语音 (TTS)。Polly 以多种语言提供数十种逼真的语音,供您构建可进行互动和转换的语音激活应用程序。满足不同地域和市场用户的语言多样化、无障碍和学习的需求。强大的神经网络和生成式语音引擎在后台为您合成语音。将 Amazon Polly API 集成到您的现有应用程序中,快速实现语音功能。 

使用案例

在拥有全球受众的应用程序中添加语音,例如 RSS 源、网站或视频。

详细了解语音生成

存储并重放 Amazon Polly 语音输出,以便在交互式或自动语音响应系统中对来电客户进行语音提示。

详细了解神经文字转语音 (TTS)

SSML 是一种基于 XML 的 W3C 标准标记语言,该工具适用于语音合成应用程序,以支持使用通用 SSML 标签进行断句、重音和语调。

详细了解 SSML

功能

Amazon Polly 具有多种功能,包括下列的一些功能

逼真的声音

以一贯的快速响应速度提供对话式用户体验。

在请求 Amazon Polly 输出时,您可以从数十种逼真的声音和各种语言中进行选择。每种语音都是由母语者创建,即使在同一语言中也有不同的声音。大多数语言都包含一种或多种男声和女声,因此您可以选择最适合您用例的声音。

站在桥上穿着黄色外套拿着电话的女士

可自定义的输出

根据需要自定义和控制语音输出

Amazon Polly 允许您创建自定义的文本转语音输出,以吸引和留住受众的注意力。使用自定义词典修改首字母缩略词、公司名称、内部术语或您选择的任何其他词语的发音。Amazon Polly 的语音合成标记语言 (SSML) 标签还允许您调整重音、语调、措辞和风格。生成最适合您业务的语音 AI 输出。

在办公室工作的男士照片

生成式人工智能力量

以低廉的成本访问内置的生成式人工智能功能

Amazon Polly 支持多种语音引擎,您可以选择将文本转换为语音。该引擎部署了一个十亿参数的转换器,以增量、可流式传输的方式生成语音。这款 AI 语音生成器创建的合成语音自信、情感丰富且非常口语化,类似于真人语音。

年轻的业务人员合作开发新项目

控制与安全

以标准格式安全存储和重新分发语音

将您的文本转语音输出存储在 MP3 和 OGG 等标准音频文件中,用于重新分发、分析、存档或任何其他用例,且无需额外付费。缓存文件以便在需要时更快地检索。保障您内容的安全、信任和隐私是 AWS 的重中之重。Amazon Polly 不会保留您提交的文本内容。

一个人用电脑工作时的手部图像

常见问题

符合。Amazon Polly 在您注册后提供为期一年的免费文字转语音 AI 服务——不超过最低使用阈值。阈值从 100,000 个字符到 500 万个字符不等,具体取决于您选择的语音引擎。有关更多详细信息,请参阅 Amazon Polly 定价
Amazon Polly 提供 100 多种男女声音,支持 40 多种语言及其变体。AWS 不断更新和增加我们的语音功能。
Amazon Polly 制作 MP3、ogg 和其他标准音频文件格式,采样率为 8,000 Hz、16,000 Hz 和 22,050 Hz。
答案是肯定的。目前,Alexa 利用 Polly 技术支持文本转语音生成解决方案。但是,Alexa 语音是专门为 Alexa 构建的,无法在外部使用。
不是。Amazon Polly 是一项完全托管的云 AI 服务。你可以通过代码中的 API 与它通信。您无法在您的环境中下载或部署 Amazon Polly 源代码。但是,您可以在注册后的 12 个月内免费使用 Amazon Polly(使用量限制在预设的阈值范围内)。有关更多详细信息,请参阅 Amazon Polly 定价