Amazon Polly

Amazon Polly - AI 음성 생성기

수십 가지 언어로 자연스러운 고음질 음성을 배포

AWS 계정 생성

Amazon Polly 시작하기

Amazon Polly란 무엇입니까?

Amazon Polly는 온디맨드 방식으로 음성을 생성하여, 어떤 텍스트라도 오디오 스트림으로 변환해주는 완전관리형 서비스입니다. 딥 러닝 기술을 사용하여 기사, 웹 페이지, PDF 문서 및 기타 TTS(텍스트 음성 변환)를 변환합니다. Polly는 실제와 같은 수십 가지 음성을 광범위한 언어로 제공하므로, 참여 및 변환이 가능한 음성 작동 애플리케이션을 구축할 수 있습니다. 여러 지역 및 시장 전반에서 사용자의 다양한 언어, 접근성 및 학습 요구 사항을 충족합니다. 강력한 신경망과 생성형 음성 엔진이 백그라운드에서 작동하여 음성을 합성합니다. Amazon Polly API를 기존 애플리케이션에 통합하여 신속하게 음성을 사용할 수 있습니다.

사용 사례

글로벌 고객을 대상으로 하는 RSS 피드, 웹 사이트 또는 동영상과 같은 애플리케이션에 음성을 추가합니다. 미래에 대비하여 모바일 및 IoT 애플리케이션이 음성 서비스를 지원할 수 있도록 하세요.

음성 생성에 대해 자세히 알아보세요.

Amazon Polly 음성 출력을 저장하고 재생하여 대화형 또는 자동화된 음성 응답 시스템을 통해 문의 고객을 안내할 수 있습니다. AI 기능을 사용하여 고객과 정서적으로 유대감을 형성하는 목소리를 만들어 보세요.

음성 엔진에 대해 자세히 알아보기

스크립트에서 직접 애니메이션, 게임 및 기타 미디어에 사용할 보이스오버를 만들 수 있습니다. W3C 표준 XML 기반 마크업 언어인 SSML을 사용하여 장면에 맞게 표현, 강조, 억양을 조정할 수 있습니다. 음성 지속 시간을 자동으로 조정하여 다국어 더빙을 쉽게 진행할 수 있습니다.

SSML에 대해 자세히 알아보기

기능

Amazon Polly는 아래에 나열된 기능을 비롯하여 다양한 기능을 갖추고 있습니다

실제 같은 음성

일관되게 빠른 응답 시간으로 대화형 사용자 경험 제공

Amazon Polly 출력을 요청할 경우, 수십 개의 실제 같은 음성 및 다양한 언어 중에서 선택할 수 있습니다. 각 음성은 원어민을 사용하여 생성되며, 동일한 언어 내에서도 음성 대 음성 변형이 있습니다. 대부분의 언어에는 하나 이상의 남성 및 여성 음성이 포함되므로, 사용 사례에 가장 적합한 언어를 선택할 수 있습니다.

A woman wearing a yellow jacket stands outside, smiling while using a pink smartphone near a metal railing and modern structure.

사용자 지정 가능한 출력

필요에 따라 음성 출력 사용자 지정 및 제어

Amazon Polly를 사용하면 청중의 관심을 끌고 유지하기 위한 사용자 지정 텍스트 음성 변환 출력을 생성할 수 있습니다. 사용자 어휘집을 사용하여 두문자어, 회사 이름, 내부 용어 또는 선택한 기타 단어의 발음을 수정할 수 있습니다. 또한 Amazon Polly의 Speech Synthesis Markup Language(SSML) 태그를 사용하여 강조, 억양, 구문, 스타일을 조정할 수 있습니다. 비즈니스에 가장 적합한 음성 AI 출력을 생성하세요.

Two people collaborating at a desk, with one working on code displayed on a laptop and the other pointing to a data visualization of yellow data points on a computer monitor, representing artificial intelligence or machine learning analysis.

생성형 AI 기반

기본 제공되는 생성형 AI 기능을 적은 비용으로 이용 가능

Amazon Polly는 텍스트를 음성으로 변환하기 위해 선택할 수 있는 여러 가지 음성 엔진을 지원합니다. 이 엔진은 10억 개의 파라미터 트랜스포머를 배포하여 점진적이고 스트리밍 가능한 방식으로 음성을 생성합니다. 이 AI 음성 생성기는 명확하고, 감정적으로 몰입하며, 자연스러운 구어체에 가까운 실제 사람의 음성과 유사한 합성 음성을 생성합니다.

텍스트 음성 변환

People collaborating at a wooden table with laptops, smartphone, potted plant, and a lightbulb lamp, suggesting teamwork and brainstorming in a modern workspace.

제어 및 보안

형식으로 음성을 안전하게 저장하고 재배포

재배포, 분석, 보관 또는 기타 사용 사례를 위해 텍스트 음성 변환 출력을 MP3 및 OGG 같은 표준 오디오 파일에 저장하여 추가 비용 없이 사용할 수 있습니다. 필요한 경우 파일을 캐시하여 더 빠르게 검색할 수 있습니다. 콘텐츠의 보안, 신뢰도, 개인 정보 보호는 AWS의 최우선 과제입니다. Amazon Polly는 사용자가 제출한 텍스트의 내용을 유지하지 않습니다.

FAQ

예. Amazon Polly는 가입 후 1년 동안 최소 사용량 임곗값까지 무료 텍스트 음성 변환 AI 서비스를 제공합니다. 임곗값은 선택하는 음성 엔진에 따라 100,000자에서 500만 자까지 다양합니다. 자세한 내용은 Amazon Polly 요금 페이지를 참조하세요.

Amazon Polly는 40개 이상의 언어 및 언어 변형을 통해 100가지 이상의 남성 및 여성 음성을 제공합니다. AWS는 음성 기능을 지속적으로 업데이트 및 추가하고 있습니다.

Amazon Polly는 8,000Hz, 16,000Hz, 22,050Hz로 샘플링된 MP3, OGG 및 기타 표준 오디오 파일 형식을 제작합니다.

답은 '예'입니다. 현재 Alexa는 Polly 기술을 사용하여 텍스트 음성 변환 생성 솔루션을 지원합니다. 그러나 Alexa의 음성은 Alexa 전용으로 제작되었으며 외부에서는 사용할 수 없습니다.

아니요. Amazon Polly는 완전관리형 클라우드 AI 서비스입니다. 코드의 API를 사용하여 이 서비스와 통신하는 방식입니다. 사용자 환경에서 Amazon Polly 소스 코드를 다운로드하거나 배포하는 건 불가합니다. 하지만 Amazon Polly는 가입 시작 후 12개월 동안 무료로(사전 정의된 사용량 임곗값 한도까지) 사용할 수 있습니다. 자세한 내용은 Amazon Polly 요금 페이지를 참조하세요.