Cartesia Sonic 3 文字轉語音模型現已在 Amazon SageMaker JumpStart 中推出

張貼日期: 2026年2月4日

Cartesia 的 Sonic 3 模型現已在 Amazon SageMaker JumpStart 中推出,擴展 AWS 客戶可用的基礎模型產品組合。Sonic 3 是 Cartesia 最新的狀態空間模型 (SSM),用於串流文字轉語音 (TTS),可提供高度自然的語音、精準的逐字稿跟隨能力,以及業界領先的低延遲,並能對音量、語速與情緒進行細緻控制。

Sonic 3 支援 42 種語言,並透過 API 參數與 SSML 標籤提供進階可控性,以調整音量、語速與情緒。此模型包含自然笑聲支援、為語音代理最佳化的穩定聲線,以及適用於表現力角色的情感聲線。Sonic 3 具備低於 100 毫秒的延遲,可支援即時對話式 AI,捕捉包含情緒與語調變化在內的人類語音細微差異。

透過 SageMaker JumpStart,客戶只需點選幾下即可部署 Sonic 3,以滿足其語音 AI 使用案例。若要開始使用此模型,請在 SageMaker Studio 中前往 SageMaker JumpStart 模型目錄,或使用 SageMaker Python SDK 將模型部署到您的 AWS 帳戶。如需在 SageMaker JumpStart 中部署與使用基礎模型的詳細資訊,請參閱 Amazon SageMaker JumpStart 文件