Amazon Polly

딥 러닝을 사용하여 텍스트를 실제 같은 음성으로 전환

Amazon Polly 듣기 >>

Amazon Polly는 텍스트를 생생한 음성으로 변환하는 서비스로서 이를 사용하면 말을 하는 애플리케이션을 만들고 전혀 새로운 유형의 음성 지원 제품을 개발할 수 있습니다. Amazon Polly는 고급 딥 러닝 기술을 사용하여 실제 사람 목소리처럼 음성을 합성하는 텍스트 음성 변환 서비스입니다.

다양한 언어로 수십 개의 생생한 음성이 제공되므로 서로 다른 여러 국가에서 적합한 음성을 선택하여 음성 지원 애플리케이션을 개발할 수 있습니다.

Amazon Polly 소개
언어 여성 남성 샘플 텍스트
영어 Joanna Matthew Hello. Do you speak a foreign language? One language is never enough.
덴마크어 Naja Mads Hej. Taler du et fremmed sprog? Et sprog er aldrig nok.
포르투갈어(브라질) Vitória Ricardo Oi. Você fala algum idioma estrangeiro? Somente um idioma nunca é bastante.
스페인어 Penélope Miguel Hola. ¿Hablas algún idioma extranjero? Un solo idioma no es suficiente.
아이슬란드어 Dóra Karl Halló, Hæ talar þú erlent tungumál? Eitt tungumál er aldrei nóg.
일본어 Mizuki
Takumi こんにちは、外国語を話せますか? 世界にはたくさんの言語があります。
한국어 Seoyeon   안녕하세요? 외국어를 구사하십니까? 이 세상에는 수많은 언어들이 있답니다。
Amazon Polly 음성 및 지원되는 언어 전체 목록은 여기에서 확인하십시오.

장점

자연스러운 음성

Amazon Polly는 12개 언어로 자연적인 남성 및 여성 음성을 다양하게 제공합니다. Amazon Polly의 유창한 텍스트 발음으로 글로벌 청중을 대상으로 고품질 음성을 제공할 수 있습니다.

음성 저장 및 재배포

Amazon Polly에서는 생성된 음성을 추가 비용 없이 무제한으로 재생할 수 있습니다. MP3 및 OGG와 같은 표준 형식으로 음성 파일을 생성하여 클라우드로부터 또는 오프라인 재생용 앱 또는 장치를 사용하여 로컬에서 제공할 수 있습니다.

실시간 스트리밍

실제 같은 음성과 대화 사용자 경험을 제공하기 위해서는 일관되게 빠른 응답 시간이 요구됩니다. Amazon Polly API로 텍스트를 전송하면 Amazon Polly API가 오디오를 스트림으로 애플리케이션에 반환하므로 즉시 음성을 재생할 수 있습니다. 

음성 출력 사용자 지정 및 제어

Amazon Polly 음성을 필요에 가장 적합하게 수정 – Amazon Polly는 어휘 및 SSML 태그를 지원하여 사용자가 발음, 볼륨, 피치, 속도 등 음성의 여러 측면을 제어할 수 있습니다.  

 

 

저렴한 비용

Amazon Polly는 종량 요금제, 저렴한 변환 문자당 비용, 무제한 재생 등 애플리케이션을 음성화하는 비용 효과적인 방법을 제공합니다.

사용 사례

콘텐츠 생성

오디오는 서면 및/또는 시각적 의사소통에 대한 보완적 매체로 사용될 수 있습니다. 콘텐츠를 음성화함으로써 청중에게 정보를 소비하는 대안적 방법을 제공하고 보다 광범위한 독자층의 요구를 충족할 수 있습니다. Amazon Polly는 12개 언어로 음성을 생성할 수 있으므로 글로벌 청중을 대상으로 RSS 피드, 웹 사이트, 비디오와 같은 애플리케이션에 간편하게 음성을 추가할 수 있습니다.

예: 기사를 음성으로 변환 후 MP3로 다운로드
Polly-1-Content_Creation@2x
Goanimate

“Amazon Polly는 GoAnimate 사용자가 당사 플랫폼을 사용하여 애니메이션화하는 캐릭터에 즉각적으로 음성을 부여하는 기능을 제공합니다. 이 기능은 예를 들어 여러 언어로 비디오를 개발하거나 승인 프로세스 시간을 단축하기 위해 사전 제작 범위 내에서 비디오를 개발하는 경우와 같이 실시간 보이스오버가 리소스 또는 시간상 불가능한 시나리오에서 특히 유용합니다. 음성은 당사의 풍부한 사전 애니메이션화된 자산과 원활하게 통합되어 GoAnimate를 더욱 사용하기 쉽게 만들 뿐 아니라 고객이 효율을 높이고 출시 시간을 단축할 수 있게 해줍니다.”

– Alvin Hung, CEO 겸 창업자, GoAnimate

사례 연구 참조 >>

온라인 교육

Amazon Polly를 사용하면 개발자가 음성이 동기화된 얼굴 애니메이션 또는 노래방 형태의 자막 강조 표시와 같은 향상된 시각적 경험을 애플리케이션에서 제공할 수 있습니다. Amazon Polly에서는 특정 문장, 단어 또는 소리가 발음되는 시점에 대한 정보가 담긴 메타데이터의 추가 스트림을 손쉽게 요청할 수 있습니다. 합성된 음성 오디오 스트림과 함께 이러한 메타데이터 스트림을 사용하면 고객이 현재 음성 텍스트를 제공하는 앱에서 아바타를 애니메이션으로 만들고 텍스트를 강조 표시할 수 있습니다.

예: 음성 재생 및 음성 텍스트 강조 표시
Polly-4-Language-Learning@2x
Duolingo

“새로운 언어를 학습할 때보다 정확한 발음이 중요한 사용 사례는 거의 없을 것입니다. Amazon Polly 음성은 품질만 높은 것이 아니라 언어 교수 용도에서 사람 음성만큼 자연스럽습니다.”

– Severin Hacker, CTO, Duolingo

블로그 게시물 읽기 >>

텔레포니

Amazon Polly를 사용하면 콜 센터가 자연스러운 음성으로 고객을 응대할 수 있습니다. Amazon Polly의 음성 출력을 캐싱하고 재생하여 Amazon Connect와 같은 대화형 음성 응답(IVR) 시스템에서 문의 고객을 안내할 수 있습니다. 또한, Amazon Polly API를 이용하여 서비스 상태, 계정 및 요금 문의, 주소, 연락처 정보와 같은 자동화된 실시간 정보를 제공할 수 있습니다.

예: 텔레포니 시스템을 위한 텍스트 음성 변환
Polly-2-Customer_Contact_Center@2x
bandwidth-hdr-logo

"Bandwidth에서는 Amazon Polly를 기반으로 작고 안정적이며 빠른 TTS 애플리케이션을 구축했습니다. 이제 저렴한 비용으로 품질이 뛰어난 음성을 사용하고 있습니다. 개발자는 놀라울 정도로 적은 노력으로 이 새로운 서비스를 구축할 수 있었습니다."

– Yiannis Philipopoulos, 선임 소프트웨어 개발자, Bandwidth 

블로그 게시물 읽기 >>

Amazon Polly에 대해 자세히 알아보기

기능 페이지로 이동하기
구축할 준비가 되셨습니까?
Amazon Polly 시작하기
질문이 있으십니까?
문의처