게시된 날짜: Nov 26, 2023

오늘 AWS는 Amazon Transcribe의 차세대, 수십억 파라미터 음성 기초 모델 기반 시스템을 발표하게 되었습니다. 이 시스템은 자동 음성 인식(ASR)을 100개 이상의 언어로 확장합니다. Amazon Transcribe는 고객이 음성을 텍스트로 변환하는 기능을 애플리케이션에 쉽게 추가할 수 있도록 지원하는 완전관리형 ASR 서비스입니다. AWS의 음성 기초 모델은 동급 최고의 자체 지도 알고리즘을 사용하여 훈련되어 언어와 억양을 넘나들며 인간 음성에 내재된 보편적인 패턴을 학습합니다.

생성형 AI의 출현으로 수천 개의 기업이 Amazon Transcribe를 사용하여 오디오 콘텐츠에서 풍부한 인사이트를 확보하고 오디오 및 비디오 콘텐츠의 접근성 및 검색 기능을 높일 수 있습니다. 예를 들어 고객 센터는 고객과의 통화를 녹음하고 분석하여 인사이트를 식별하고 결과적으로 고객 경험과 에이전트의 생산성을 개선합니다. 콘텐츠 제작자와 미디어 배포자는 콘텐츠 접근성을 개선하기 위해 Amazon Transcribe를 사용하여 자동으로 자막을 생성합니다.

배치 모드에서 Amazon Transcribe를 사용하는 모든 기존 고객과 신규 고객은 API 엔드포인트 또는 입력 파라미터를 변경하지 않고도 100개 이상의 언어에 대한 정확도를 개선할 수 있습니다. 이 기능은 미국 동부(오하이오), 미국 동부(버지니아 북부), 미국 서부(캘리포니아 북부), 미국 서부(오레곤), 아시아 태평양(홍콩), 아시아 태평양(뭄바이), 아시아 태평양(서울), 아시아 태평양(싱가포르), 아시아 태평양(시드니), 아시아 태평양(도쿄), 캐나다(중부), 유럽(프랑크푸르트), 유럽(아일랜드), 유럽(런던), 유럽(파리), 유럽(스톡홀름), 중동(바레인) 및 남아메리카(상파울루) 등의 AWS 리전에서 사용할 수 있습니다. 시작하려면 서비스 콘솔로 이동하거나 10분 자습서로 오디오 트랜스크립트를 생성합니다. 자세한 내용을 알아보려면 블로그 게시물설명서를 참조하세요.