Cartesia Sonic 3 텍스트 음성 변환 모델, 이제 Amazon SageMaker JumpStart에서 사용 가능
이제 Amazon SageMaker JumpStart에서 Cartesia의 Sonic 3 모델이 출시되어, AWS 고객이 사용할 수 있는 파운데이션 모델 포트폴리오가 더욱 확장되었습니다. Sonic 3는 Cartesia의 텍스트 음성 변환(TTS) 스트리밍용 상태 공간 모델(SSM)로, 상당한 자연스러움, 정확한 텍스트 트랜스크립션, 업계 최고 수준의 지연 시간을 제공하며 볼륨, 속도, 감정에 대한 정밀한 제어 기능을 보장합니다.
Sonic 3은 42개 언어를 지원하며 볼륨, 속도, 감정 조정을 위한 API 파라미터와 SSML 태그를 통해 고급 제어 기능을 제공합니다. 이 모델에는 자연스러운 웃음 지원, 음성 에이전트에 최적화된 안정적인 음성, 표현력이 풍부한 캐릭터를 위한 감성적인 음성이 포함됩니다. 지연 시간이 100ms 미만인 Sonic 3는 감정과 톤 변화를 포함한 인간의 음성 뉘앙스를 포착하는 실시간 대화형 AI를 지원합니다.
SageMaker JumpStart를 통해 고객은 단 몇 번의 클릭만으로 Sonic 3를 배포하여 음성 AI 사용 사례를 해결할 수 있습니다. 이 모델을 시작하려면 SageMaker Studio의 SageMaker JumpStart 모델 카탈로그로 이동하거나 SageMaker Python SDK를 사용하여 모델을 AWS 계정에 배포하세요. SageMaker JumpStart에서 파운데이션 모델을 배포하고 사용하는 방법에 대한 자세한 내용은 Amazon SageMaker JumpStart 설명서를 참조하세요.