Il modello di sintesi vocale di Cartesia Sonic 3 è ora disponibile su Amazon SageMaker JumpStart

Inserito il: 4 feb 2026

Il modello Sonic 3 di Cartesia è ora disponibile in Amazon SageMaker JumpStart, estendendo la gamma di modelli di fondazione a disposizione dei clienti AWS. Sonic 3 è l'ultimo modello State Space Model (SSM, modello a spazio degli stati) di Cartesia per sintesi vocale in streaming, che offre elevata naturalezza, accurata aderenza alla trascrizione e latenza ai vertici del settore con controllo granulare su volume, velocità ed emozione.

Sonic 3 supporta 42 lingue e offre controllabilità avanzata tramite parametri API e tag SSML per la regolazione di volume, velocità ed emozione. Il modello include supporto per risate naturali, voci stabili ottimizzate per agenti vocali e voci emotive per personaggi espressivi. Con una latenza inferiore a 100 ms, Sonic 3 abilita un'IA conversazionale in tempo reale in grado di cogliere le sfumature della voce umana, incluse emozioni e variazioni di intonazione.

SageMaker JumpStart consente ai clienti di distribuire Sonic 3 con pochi clic per gestire i propri casi d'uso di IA vocale. Per iniziare a utilizzare il modello, accedi al catalogo dei modelli di SageMaker JumpStart in SageMaker Studio oppure utilizza SageMaker Python SDK per distribuire il modello nell'account AWS. Per ulteriori informazioni sulla distribuzione e l'utilizzo dei modelli di fondazione in SageMaker JumpStart, consulta la documentazione di Amazon SageMaker JumpStart.

Il modello di sintesi vocale di Cartesia Sonic 3 è ora disponibile su Amazon SageMaker JumpStart

Scopri

Risorse

Sviluppatori

Assistenza