什么是 Amazon Polly?
Amazon Polly 是一项完全托管的服务,可按需生成语音,将任何文本转换为音频流。使用深度学习技术转换文章、网页、PDF 文档和其他文本转语音(TTS)。Polly 以多种语言提供数十种逼真的语音,供您构建可进行互动和转换的语音激活应用程序。满足不同地域和市场用户的语言多样化、无障碍和学习的需求。强大的神经网络和生成式语音引擎在后台为您合成语音。将 Amazon Polly API 集成到您的现有应用程序中,快速实现语音功能。
使用案例
生成数十种语言的语音。
在拥有全球受众的应用程序中添加语音,例如 RSS 源、网站或视频。让您的移动和物联网应用程序为未来的语音功能做好准备。
详细了解语音生成。
以自然的声音吸引客户
存储并重放 Amazon Polly 语音输出,以便在交互式或自动语音响应系统中对来电客户进行语音提示。利用 AI 功能生成与客户情感连接的声音。
以低成本为媒体创建音频
直接从脚本中为动画、游戏和其他媒体创建画外音。使用 SSML(一种基于 W3C 标准 XML 的标记语言)调整措辞、重音和语调以符合使用场景。自动调整语音时长以方便多语言配音。
功能
Amazon Polly 具有多种功能,包括下列的一些功能
逼真的声音
以一贯的快速响应速度提供对话式用户体验。
在请求 Amazon Polly 输出时,您可以从数十种逼真的声音和各种语言中进行选择。每种语音都是由母语者创建,即使在同一语言中也有不同的声音。大多数语言都包含一种或多种男声和女声,因此您可以选择最适合您用例的声音。

可自定义的输出
根据需要自定义和控制语音输出
Amazon Polly 允许您创建自定义的文本转语音输出,以吸引和留住受众的注意力。使用自定义词典修改首字母缩略词、公司名称、内部术语或您选择的任何其他词语的发音。Amazon Polly 的语音合成标记语言 (SSML) 标签还允许您调整重音、语调、措辞和风格。生成最适合您业务的语音 AI 输出。

控制与安全
以标准格式安全存储和重新分发语音
将您的文本转语音输出存储在 MP3 和 OGG 等标准音频文件中,用于重新分发、分析、存档或任何其他用例,且无需额外付费。缓存文件以便在需要时更快地检索。保障您内容的安全、信任和隐私是 AWS 的重中之重。Amazon Polly 不会保留您提交的文本内容。

常见问题