El modelo de conversión de texto a voz de Cartesia Sonic 3 ya está disponible en Amazon SageMaker JumpStart
El modelo Sonic 3 de Cartesia ya está disponible en Amazon SageMaker JumpStart, lo que amplía la cartera de modelos fundacionales disponibles para los clientes de AWS. Sonic 3 es el modelo de espacio estatal (SSM) más reciente de Cartesia para la transmisión de texto a voz (TTS), que ofrece una gran naturalidad, un seguimiento preciso de las transcripciones y una latencia líder en el sector con un control detallado del volumen, la velocidad y la emoción.
Sonic 3 admite 42 idiomas y proporciona una capacidad de control avanzada a través de parámetros de API y etiquetas SSML para ajustes de volumen, velocidad y emoción. El modelo incluye compatibilidad con risa natural, voces estables optimizadas para agentes de voz y voces emotivas para personajes expresivos. Con una latencia inferior a 100 ms, Sonic 3 permite una IA conversacional en tiempo real que captura los matices del habla humana, incluidas las emociones y los cambios tonales.
Con SageMaker JumpStart, los clientes pueden implementar Sonic 3 con solo unos clics para abordar sus casos de uso de IA de voz. Para comenzar con este modelo, navegue hasta el catálogo de modelos de SageMaker JumpStart en SageMaker Studio o utilice el SDK de Python de SageMaker para implementar el modelo en su cuenta de AWS. Para obtener más información sobre la implementación y el uso de modelos fundacionales en SageMaker JumpStart, consulte la documentación de Amazon SageMaker JumpStart.