Amazon Polly - AI 语音生成器

配置数十种语言的高质量自然人声

什么是 Amazon Polly?

Amazon Polly 是一项完全托管的服务,可按需生成语音,将任何文本转换为音频流。使用深度学习技术转换文章、网页、PDF 文档和其他文本转语音 (TTS)。Polly 以多种语言提供数十种逼真的语音,供您构建可进行互动和转换的语音激活应用程序。满足不同地域和市场用户的语言多样化、无障碍和学习的需求。强大的神经网络和生成式语音引擎在后台为您合成语音。将 Amazon Polly API 集成到您的现有应用程序中,快速实现语音功能。 

使用案例

功能

Amazon Polly 具有多种功能,包括下列的一些功能

逼真的声音

以一贯的快速响应速度提供对话式用户体验。

在请求 Amazon Polly 输出时,您可以从数十种逼真的声音和各种语言中进行选择。每种语音都是由母语者创建,即使在同一语言中也有不同的声音。大多数语言都包含一种或多种男声和女声,因此您可以选择最适合您用例的声音。

站在桥上穿着黄色外套拿着电话的女士

可自定义的输出

根据需要自定义和控制语音输出

Amazon Polly 允许您创建自定义的文本转语音输出,以吸引和留住受众的注意力。使用自定义词典修改首字母缩略词、公司名称、内部术语或您选择的任何其他词语的发音。Amazon Polly 的语音合成标记语言 (SSML) 标签还允许您调整重音、语调、措辞和风格。生成最适合您业务的语音 AI 输出。

在办公室工作的男士照片

生成式人工智能力量

以低廉的成本访问内置的生成式人工智能功能

Amazon Polly 支持多种语音引擎,您可以选择将文本转换为语音。该引擎部署了一个十亿参数的转换器,以增量、可流式传输的方式生成语音。这款 AI 语音生成器创建的合成语音自信、情感丰富且非常口语化,类似于真人语音。

年轻的业务人员合作开发新项目

控制与安全

以标准格式安全存储和重新分发语音

将您的文本转语音输出存储在 MP3 和 OGG 等标准音频文件中,用于重新分发、分析、存档或任何其他用例,且无需额外付费。缓存文件以便在需要时更快地检索。保障您内容的安全、信任和隐私是 AWS 的重中之重。Amazon Polly 不会保留您提交的文本内容。

一个人用电脑工作时的手部图像

常见问题


深入了解 AWS