Модель преобразования текста в речь Cartesia Sonic 3 теперь доступна в Amazon SageMaker JumpStart

Проведено: 4 февр. 2026 г.

Amazon SageMaker JumpStart расширяет портфель базовых моделей, доступных клиентам AWS, за счет модели Sonic 3 от Cartesia. Sonic 3 – это новейшая модель пространства состояний (SSM) от компании Cartesia для потокового преобразования текста в речь (TTS), обеспечивающая высокую естественность, точное следование стенограммам и самую низкую в отрасли задержку, а также точнейшее управление громкостью, скоростью и выражением.

Sonic 3 поддерживает 42 языка и обеспечивает расширенный контроль над громкостью, скоростью и выражением с помощью параметров API и тегов SSML. Модель поддерживает естественный смех, нейтральные голоса, оптимизированные для голосовых агентов, и эмоциональные голоса для выразительных персонажей. Благодаря задержке менее 100 мс модель Sonic 3 позволяет использовать диалоговый искусственный интеллект в реальном времени, сохраняя нюансы человеческой речи, с том числе эмоции и изменения тона.

Используя SageMaker JumpStart, клиенты могут развернуть Sonic 3 всего несколькими щелчками мыши для своих примеров использования голосового искусственного интеллекта. Чтобы начать работу с этой моделью, откройте каталог моделей SageMaker JumpStart в Студии SageMaker или воспользуйтесь пакетом средств разработки ПО (SDK) SageMaker для Python, чтобы развернуть модель в своем аккаунте AWS. Подробные инструкции о развертывании и использовании базовых моделей в SageMaker JumpStart см. в документации Amazon SageMaker JumpStart.