Amazon Polly

Amazon Polly - AI 语音生成器

配置数十种语言的高质量自然人声

创建 AWS 账户

开始使用 Amazon Polly

什么是 Amazon Polly？

Amazon Polly 是一项完全托管的服务，可按需生成语音，将任何文本转换为音频流。使用深度学习技术转换文章、网页、PDF 文档和其他文本转语音（TTS）。Polly 以多种语言提供数十种逼真的语音，供您构建可进行互动和转换的语音激活应用程序。满足不同地域和市场用户的语言多样化、无障碍和学习的需求。强大的神经网络和生成式语音引擎在后台为您合成语音。将 Amazon Polly API 集成到您的现有应用程序中，快速实现语音功能。

使用案例

在拥有全球受众的应用程序中添加语音，例如 RSS 源、网站或视频。让您的移动和物联网应用程序为未来的语音功能做好准备。

详细了解语音生成。

存储并重放 Amazon Polly 语音输出，以便在交互式或自动语音响应系统中对来电客户进行语音提示。利用 AI 功能生成与客户情感连接的声音。

了解有关语音引擎的更多信息

直接从脚本中为动画、游戏和其他媒体创建画外音。使用 SSML（一种基于 W3C 标准 XML 的标记语言）调整措辞、重音和语调以符合使用场景。自动调整语音时长以方便多语言配音。

详细了解 SSML

功能

Amazon Polly 具有多种功能，包括下列的一些功能

逼真的声音

以一贯的快速响应速度提供对话式用户体验。

在请求 Amazon Polly 输出时，您可以从数十种逼真的声音和各种语言中进行选择。每种语音都是由母语者创建，即使在同一语言中也有不同的声音。大多数语言都包含一种或多种男声和女声，因此您可以选择最适合您用例的声音。

A woman wearing a yellow jacket stands outside, smiling while using a pink smartphone near a metal railing and modern structure.

可自定义的输出

根据需要自定义和控制语音输出

Amazon Polly 允许您创建自定义的文本转语音输出，以吸引和留住受众的注意力。使用自定义词典修改首字母缩略词、公司名称、内部术语或您选择的任何其他词语的发音。Amazon Polly 的语音合成标记语言 (SSML) 标签还允许您调整重音、语调、措辞和风格。生成最适合您业务的语音 AI 输出。

Two people collaborating at a desk, with one working on code displayed on a laptop and the other pointing to a data visualization of yellow data points on a computer monitor, representing artificial intelligence or machine learning analysis.

生成式人工智能力量

以低廉的成本访问内置的生成式人工智能功能

Amazon Polly 支持多种语音引擎，您可以选择将文本转换为语音。该引擎部署了一个十亿参数的转换器，以增量、可流式传输的方式生成语音。这款 AI 语音生成器创建的合成语音自信、情感丰富且非常口语化，类似于真人语音。

People collaborating at a wooden table with laptops, smartphone, potted plant, and a lightbulb lamp, suggesting teamwork and brainstorming in a modern workspace.

控制与安全

以标准格式安全存储和重新分发语音

将您的文本转语音输出存储在 MP3 和 OGG 等标准音频文件中，用于重新分发、分析、存档或任何其他用例，且无需额外付费。缓存文件以便在需要时更快地检索。保障您内容的安全、信任和隐私是 AWS 的重中之重。Amazon Polly 不会保留您提交的文本内容。

常见问题

可以。Amazon Polly 在您注册后提供为期一年的免费文字转语音 AI 服务——不超过最低使用阈值。阈值从 10 万个字符到 500 万个字符不等，具体取决于您选择的语音引擎。有关更多详细信息，请参阅 Amazon Polly 定价。

从 2025 年 7 月 15 日起，新的 AWS 客户将获得高达 200 美元的 AWS 免费套餐服务抵扣金，可用于购买符合条件的 AWS 服务，包括 Amazon Polly。在账户注册时，您可以在免费套餐和付费套餐之间进行选择。免费套餐将在账户创建后的 6 个月内有效。如果您升级到付费套餐，剩余的免费套餐服务抵扣金余额将自动计入您的 AWS 账单。所有免费套餐服务抵扣金必须在账户创建之日起 12 个月内使用。如需了解有关 AWS 免费套餐计划的更多信息，请参阅 AWS 免费套餐网站和 AWS 免费套餐文档。

Amazon Polly 提供 100 多种男女声音，支持 40 多种语言及其变体。AWS 不断更新和增加我们的语音功能。

Amazon Polly 制作 MP3、ogg 和其他标准音频文件格式，采样率为 8,000 Hz、16,000 Hz 和 22,050 Hz。

答案是肯定的。目前，Alexa 利用 Polly 技术支持文本转语音生成解决方案。但是，Alexa 语音是专门为 Alexa 构建的，无法在外部使用。

不是。Amazon Polly 是一项完全托管的云 AI 服务。你可以通过代码中的 API 与它通信。您无法在您的环境中下载或部署 Amazon Polly 源代码。但是，您可以在注册后的 12 个月内免费使用 Amazon Polly（使用量限制在预设的阈值范围内）。有关更多详细信息，请参阅 Amazon Polly 定价。

从 2025 年 7 月 15 日起，新的 AWS 客户将获得高达 200 美元的 AWS 免费套餐服务抵扣金，可用于购买符合条件的 AWS 服务，包括 Amazon Polly。在账户注册时，您可以在免费套餐和付费套餐之间进行选择。免费套餐将在账户创建后的 6 个月内有效。如果您升级到付费套餐，剩余的 Free Tier 服务抵扣金余额将自动计入您的 AWS 账单。所有 Free Tier 服务抵扣金必须在账户创建之日起 12 个月内使用。如需了解有关 AWS 免费套餐计划的更多信息，请参阅 AWS 免费套餐网站和 AWS 免费套餐文档。