Cartesia Sonic 3 テキスト読み上げモデルが Amazon SageMaker JumpStart で利用可能に
Cartesia の Sonic 3 モデルが Amazon SageMaker JumpStart で利用できるようになりました。これにより、AWS のお客様が利用できる基盤モデルのポートフォリオが拡大しました。Sonic 3 は、Cartesia のストリーミング音声合成 (TTS) 向けの最新の状態空間モデル (SSM) であり、高い自然さ、正確なトランスクリプトのフォロー、そして業界をリードする低レイテンシーを実現し、音量、速度、感情をきめ細かく制御できます。
Sonic 3 は 42 の言語をサポートし、音量、速度、感情の調整のための API パラメータと SSML タグによる高度な制御機能を提供します。このモデルには、自然な笑い声のサポート、音声エージェント向けに最適化された安定した音声、表情豊かなキャラクター向けの感情豊かな音声が含まれています。Sonic 3 は 100 ミリ秒未満のレイテンシーで、感情や音調の変化など、人間の話し言葉のニュアンスをキャプチャするリアルタイムの会話型 AI を実現します。
SageMaker JumpStart を使用すると、お客様は数回クリックするだけで Sonic 3 をデプロイし、音声 AI のユースケースに対応できます。このモデルを使い始めるには、SageMaker Studio の SageMaker JumpStart モデルカタログにアクセスするか、SageMaker Python SDK を使用してモデルを AWS アカウントにデプロイしてください。SageMaker JumpStart での基盤モデルのデプロイと使用方法の詳細については、Amazon SageMaker JumpStart のドキュメントをご覧ください。