Modelo de conversão de texto em fala do Cartesia Sonic 3 já está disponível no Amazon SageMaker JumpStart
O modelo Sonic 3 da Cartesia já está disponível no Amazon SageMaker JumpStart, ampliando o portfólio de modelos de base disponíveis para clientes da AWS. O Sonic 3 é o mais recente modelo de espaços de estados (SSM) da Cartesia para fluxos de conversão de texto em fala (TTS). O modelo oferece alta naturalidade, acompanhamento preciso da transcrição e latência líder do setor com controle detalhado de volume, velocidade e emoção.
O Sonic 3 aceita 42 idiomas e oferece controles avançados usando parâmetros de API e tags de SSML para ajustar volume, velocidade e emoção. O modelo oferece risadas naturais, vozes estáveis otimizadas para agentes de voz e vozes emotivas para personagens expressivos. Com latência abaixo de 100 ms, o Sonic 3 habilita uma IA conversacional em tempo real que captura as nuances da fala humana, incluindo emoções e mudanças tonais.
Com o SageMaker JumpStart, os clientes podem implantar o Sonic 3 com apenas alguns cliques para atender a casos de uso de IA de voz. Para começar a usar esse modelo, navegue até o catálogo de modelos do SageMaker JumpStart no SageMaker Studio ou use o SageMaker Python SDK para implantar o modelo em sua conta da AWS. Para obter mais informações sobre a implantação e o uso de modelos de base no SageMaker JumpStart, consulte a documentação do Amazon SageMaker JumpStart.