Amazon SageMaker JumpStart에 음성 인식 및 텍스트 음성 변환을 위한 새로운 모델 3종 추가

게시된 날짜: 2026년 5월 14일

오늘 AWS는 Amazon SageMaker JumpStart에서 Qwen3-TTS-12Hz-1.7B-CustomVoice, Qwen3-TTS-12Hz-1.7B-Base, Qwen3-ASR-1.7B를 출시하여 AWS 고객이 사용할 수 있는 파운데이션 모델 포트폴리오를 확장한다고 발표했습니다. Qwen의 이 3개 모델은 10개 이상의 언어에 걸쳐 고급 음성 합성 및 인식 기능을 제공하여 고객이 AWS 인프라에서 지능형 음성 기반 애플리케이션을 구축할 수 있도록 지원합니다.

이러한 모델은 특수 기능을 통해 다양한 엔터프라이즈 음성 및 오디오 문제를 해결합니다.

Qwen3-TTS-12Hz-1.7B-CustomVoice는 사용자 지정 가능한 음성 스타일을 통해 다국어 텍스트 음성 변환에 탁월하며, 10개 언어를 지원하고 음색, 감정, 운율을 명령 기반으로 제어할 수 있습니다. 이 소프트웨어는 실시간 대화형 음성 애플리케이션, 고객 대면 가상 비서, 자연스럽고 표현력 있는 음성 출력이 필요한 콘텐츠 제작 워크플로 구축에 이상적입니다.

Qwen3-TTS-12Hz-1.7B-Base는 다국어 텍스트 음성 변환에 탁월하며, 오디오 입력에서 3초 만에 빠른 음성 복제를 수행합니다. 이 소프트웨어는 맞춤형 음성 애플리케이션 구축, 도메인별 음성 합성 미세 조정, 개발자가 음성 생성을 위한 유연한 파운데이션 모델을 필요로 하는 시나리오에 이상적입니다.

복잡한 음향 환경에서 최첨단 정확도로 52개 언어 및 방언을 지원하는 Qwen3-ASR-1.7B는 자동 음성 인식 기능이 뛰어납니다. 전사 서비스, 다국어 고객 지원, 실시간 자막 생성, 강력한 스트리밍, 오프라인 음성 텍스트 변환이 필요한 애플리케이션에 이상적입니다.

SageMaker JumpStart를 사용하면 고객은 몇 번의 클릭만으로 이러한 모델을 배포하여 특정 AI 사용 사례를 해결할 수 있습니다.

이러한 모델을 시작하려면 SageMaker Studio의 Models 섹션으로 이동하거나 SageMaker Python SDK를 사용하여 모델을 AWS 계정에 배포하세요. SageMaker JumpStart에서 파운데이션 모델을 배포하고 사용하는 방법에 대한 자세한 내용은 Amazon SageMaker JumpStart 설명서를 참조하세요.

Amazon SageMaker JumpStart에 음성 인식 및 텍스트 음성 변환을 위한 새로운 모델 3종 추가

알아보기

리소스

개발자

도움말