Amazon Polly - AI 음성 생성기

수십 가지 언어로 자연스러운 고음질 음성을 배포

Amazon Polly란 무엇입니까?

Amazon Polly는 온디맨드 방식으로 음성을 생성하여, 어떤 텍스트라도 오디오 스트림으로 변환해주는 완전관리형 서비스입니다. 딥 러닝 기술을 사용하여 기사, 웹 페이지, PDF 문서 및 기타 TTS(텍스트 음성 변환)를 변환합니다. Polly는 실제와 같은 수십 가지 음성을 광범위한 언어로 제공하므로, 참여 및 변환이 가능한 음성 작동 애플리케이션을 구축할 수 있습니다. 여러 지역 및 시장 전반에서 사용자의 다양한 언어, 접근성 및 학습 요구 사항을 충족합니다. 강력한 신경망과 생성형 음성 엔진이 백그라운드에서 작동하여 음성을 합성합니다. Amazon Polly API를 기존 애플리케이션에 통합하여 신속하게 음성을 사용할 수 있습니다. 

기능

Amazon Polly는 아래에 나열된 기능을 비롯하여 다양한 기능을 갖추고 있습니다

실제 같은 음성

일관되게 빠른 응답 시간으로 대화형 사용자 경험 제공

Amazon Polly 출력을 요청할 경우, 수십 개의 실제 같은 음성 및 다양한 언어 중에서 선택할 수 있습니다. 각 음성은 원어민을 사용하여 생성되며, 동일한 언어 내에서도 음성 대 음성 변형이 있습니다. 대부분의 언어에는 하나 이상의 남성 및 여성 음성이 포함되므로, 사용 사례에 가장 적합한 언어를 선택할 수 있습니다.

노란 재킷을 입고 전화기를 들고 다리 위에 있는 여자

사용자 지정 가능한 출력

필요에 따라 음성 출력 사용자 지정 및 제어

Amazon Polly를 사용하면 청중의 관심을 끌고 유지하기 위한 사용자 지정 텍스트 음성 변환 출력을 생성할 수 있습니다. 사용자 어휘집을 사용하여 두문자어, 회사 이름, 내부 용어 또는 선택한 기타 단어의 발음을 수정할 수 있습니다. 또한 Amazon Polly의 Speech Synthesis Markup Language(SSML) 태그를 사용하여 강조, 억양, 구문, 스타일을 조정할 수 있습니다. 비즈니스에 가장 적합한 음성 AI 출력을 생성하세요.

사무실에서 일하고 있는 남자 이미지

생성형 AI 기반

기본 제공되는 생성형 AI 기능을 적은 비용으로 이용 가능

Amazon Polly는 텍스트를 음성으로 변환하기 위해 선택할 수 있는 여러 가지 음성 엔진을 지원합니다. 이 엔진은 10억 개의 파라미터 트랜스포머를 배포하여 점진적이고 스트리밍 가능한 방식으로 음성을 생성합니다. 이 AI 음성 생성기는 명확하고, 감정적으로 몰입하며, 자연스러운 구어체에 가까운 실제 사람의 음성과 유사한 합성 음성을 생성합니다.

함께 새로운 프로젝트를 위해 일하는 젊은 사업가들

제어 및 보안

형식으로 음성을 안전하게 저장하고 재배포

재배포, 분석, 보관 또는 기타 사용 사례를 위해 텍스트 음성 변환 출력을 MP3 및 OGG 같은 표준 오디오 파일에 저장하여 추가 비용 없이 사용할 수 있습니다. 필요한 경우 파일을 캐시하여 더 빠르게 검색할 수 있습니다. 콘텐츠의 보안, 신뢰도, 개인 정보 보호는 AWS의 최우선 과제입니다. Amazon Polly는 사용자가 제출한 텍스트의 내용을 저장하지 않습니다.

PC에서 작업하는 사람의 손 이미지

사용 사례

글로벌 고객을 대상으로 하는 RSS 피드, 웹 사이트 또는 동영상과 같은 애플리케이션에 음성을 추가합니다.

음성 생성에 대해 자세히 알아보기

Amazon Polly 음성 출력을 저장하고 재생하여 대화형 또는 자동화된 음성 응답 시스템을 통해 문의 고객을 안내할 수 있습니다.

신경망 텍스트 음성 변환(TTS)에 대해 자세히 알아보기

음성 합성 애플리케이션을 위한 SSML, W3C 표준, XML 기반 마크업 언어를 사용하고 표현, 강조 및 억양을 위한 일반 SSML 태그를 지원합니다.

SSML에 대해 자세히 알아보기