Cartesia Sonic 3 文本转语音模型现已在 Amazon SageMaker JumpStart 推出

发布于: 2026年2月4日

Cartesia 的 Sonic 3 模型现已在 Amazon SageMaker JumpStart 中提供，为 AWS 客户提供了更丰富的基础模型选择。Sonic 3 是 Cartesia 最新推出的流式文本转语音（TTS）状态空间模型（SSM），具备高度自然的语音效果、精准的文本跟随能力，以及业界领先的低延迟特性，同时支持对音量、语速和情感的精细化控制。

Sonic 3 支持 42 种语言，并通过 API 参数和 SSML 标签提供高级可控性，可调整音量、语速和情绪。该模型包含自然笑声支持、专为语音代理优化的稳定声音，以及用于富有表现力角色的情感化声音。凭借低于 100 毫秒的延迟，Sonic 3 实现了实时对话式人工智能，能够捕捉人类语音的细微差别，包括情感变化和语调变化。

借助 SageMaker JumpStart，客户只需点击几下即可部署 Sonic 3 来解决他们的语音人工智能使用案例。要开始使用此模型，请导航到 SageMaker Studio 中的 SageMaker JumpStart 模型目录，或使用 SageMaker Python SDK 将模型部署到您的 AWS 账户。有关在 SageMaker JumpStart 中部署和使用基础模型的更多信息，请参阅 Amazon SageMaker JumpStart 文档。

Cartesia Sonic 3 文本转语音模型现已在 Amazon SageMaker JumpStart 推出

了解

资源

开发人员

帮助