Cartesia Sonic 3 Text-to-Speech-Modell ist jetzt auf Amazon SageMaker JumpStart verfügbar

Veröffentlicht am: 4. Feb. 2026

Das Sonic 3-Modell von Cartesia ist jetzt in Amazon SageMaker JumpStart verfügbar und erweitert damit das Portfolio der Foundation-Modelle, die AWS-Kunden zur Verfügung stehen. Sonic 3 ist Cartesias neuestes State Space Model (SSM) für das Streamen von Text-to-Speech (TTS). Es bietet eine hohe Natürlichkeit, genaue Transkriptverfolgung und branchenführende Latenz mit detaillierter Steuerung von Lautstärke, Geschwindigkeit und Emotionen.

Sonic 3 unterstützt 42 Sprachen und bietet erweiterte Steuerbarkeit über API-Parameter und SSML-Tags für Lautstärke-, Geschwindigkeits- und Emotionsanpassungen. Das Modell umfasst Support für natürliches Lachen, stabile Stimmen, die für Sprach-Agents optimiert sind, und emotionale Stimmen für ausdrucksstarke Charaktere. Mit einer Latenz von unter 100 ms ermöglicht Sonic 3 Konversations-KI in Echtzeit, die menschliche Sprachnuancen wie Emotionen und Tonveränderungen erfasst.

Mit SageMaker JumpStart können Kunden Sonic 3 mit nur wenigen Klicks bereitstellen, um ihre Anwendungsfälle mit Sprach-KI zu lösen. Um mit diesem Modell zu beginnen, navigieren Sie in SageMaker-Studio zum SageMaker JumpStart-Modellkatalog oder nutzen Sie das SageMaker-Python-SDK, um die Modelle in Ihrem AWS-Konto bereitzustellen. Weitere Informationen zur Bereitstellung und Verwendung von Foundation-Modellen in SageMaker JumpStart finden Sie in der Dokumentation zu Amazon SageMaker JumpStart.