Cartesia Sonic 3 文本转语音模型现已在 Amazon SageMaker JumpStart 推出
发布于:
2026年2月4日
Cartesia 的 Sonic 3 模型现已在 Amazon SageMaker JumpStart 中提供,为 AWS 客户提供了更丰富的基础模型选择。Sonic 3 是 Cartesia 最新推出的流式文本转语音(TTS)状态空间模型(SSM),具备高度自然的语音效果、精准的文本跟随能力,以及业界领先的低延迟特性,同时支持对音量、语速和情感的精细化控制。
Sonic 3 支持 42 种语言,并通过 API 参数和 SSML 标签提供高级可控性,可调整音量、语速和情绪。该模型包含自然笑声支持、专为语音代理优化的稳定声音,以及用于富有表现力角色的情感化声音。凭借低于 100 毫秒的延迟,Sonic 3 实现了实时对话式人工智能,能够捕捉人类语音的细微差别,包括情感变化和语调变化。
借助 SageMaker JumpStart,客户只需点击几下即可部署 Sonic 3 来解决他们的语音人工智能使用案例。要开始使用此模型,请导航到 SageMaker Studio 中的 SageMaker JumpStart 模型目录,或使用 SageMaker Python SDK 将模型部署到您的 AWS 账户。有关在 SageMaker JumpStart 中部署和使用基础模型的更多信息,请参阅 Amazon SageMaker JumpStart 文档。