Amazon Polly는 텍스트를 생생한 음성으로 변환하는 서비스입니다. Amazon Polly에는 수십 개의 생생한 음성과 다양한 언어에 대한 지원이 포함되어 있으므로 많은 국가에서 적합한 목소리를 선택하여 음성 지원 애플리케이션을 배포할 수 있습니다. Amazon Polly에서는 음성으로 변환하려는 텍스트를 Amazon Polly API로 전송하기만 하면 Amazon Polly가 오디오 스트림을 애플리케이션으로 즉시 반환하므로 직접 재생하거나 MP3와 같은 표준 오디오 파일 형식으로 저장할 수 있습니다.

Amazon Polly 사용해 보기

무료 계정에 가입
또는 콘솔에 로그인

Amazon Polly 프리 티어는 첫 번째 음성 요청부터 시작해 첫 12개월 동안 매월 500만 자의 글자를 포함합니다.

AWS 프리 티어 세부 정보 보기 »

Amazon Polly는 음성 합성을 애플리케이션에 신속하게 통합할 수 있도록 API를 제공합니다. 음성으로 변환하려는 텍스트를 Amazon Polly API로 전송하기만 하면 Amazon Polly가 오디오 스트림을 애플리케이션으로 즉시 반환하므로 애플리케이션이 직접 이를 스트리밍하거나 MP3와 같은 표준 오디오 파일 형식으로 저장할 수 있습니다.

샘플링 비율 샘플 코드
"Hi. My name is Joanna." from boto3 import client
polly = client("polly", region_name="us-east-1")
response = polly.synthesize_speech(
        Text="Hi. My name is Joanna.",
        OutputFormat="mp3",
        VoiceId="Joanna")

Amazon Polly에는 수십 개의 생생한 음성과 다양한 언어에 대한 지원이 포함되어 있으므로 많은 국가에서 적합한 목소리를 선택하여 음성 지원 애플리케이션을 배포할 수 있습니다.

언어 여성
남성
호주 영어 Nicole Russell
브라질식 포르투갈어 Vitória Ricardo
캐나다 프랑스어 Chantal  
덴마크어 Naja Mads
네덜란드어 Lotte Ruben
프랑스어 Céline Mathieu
독일어 Vicki Hans
  Marlene  
아이슬란드어 Dóra Karl
인도 영어 Raveena  
  Aditi  
이탈리아어 Carla Giorgio
일본어 Mizuki Takumi
한국어 Seoyeon  
노르웨이어 Liv  
폴란드어 Ewa Jacek
  Maja Jan
이베리아식 포르투갈어 Inês Cristiano
루마니아어 Carmen  
러시아어 Tatyana Maxim
카스티야 스페인어 Conchita Enrique
스웨덴어 Astrid  
터키어 Filiz  
영국 영어 Amy Brian
  Emma  
미국 영어 Joanna Matthew
  Salli Justin
  Kendra Joey
  Kimberly  
  Ivy  
미국 스페인어 Penélope Miguel
웨일스어 Gwyneth  
웨일스 영어   Geraint

Amazon Polly에서는 특정 문장, 단어 또는 소리가 발음되는 시점에 대한 정보를 제공하는 메타데이터의 추가 스트림을 손쉽게 요청할 수 있습니다. 합성된 음성 오디오 스트림과 함께 이러한 메타데이터 스트림을 사용하면 이제 음성이 동기화된 얼굴 애니메이션 또는 노래방 형태의 자막 강조 표시와 같은 향상된 시각적 경험이 적용된 애플리케이션을 구축할 수 있습니다.

인용 부호 기능을 사용하는 방법에 대한 자세한 내용은 설명서를 참조하십시오.

Amazon Polly에서는 애플리케이션을 통해 사용자에게로 모든 종류의 정보를 거의 실시간으로 스트리밍할 수 있습니다. 또한, 다양한 샘플링 비율에서 선택하여 애플리케이션의 대역폭과 오디오 품질을 최적화할 수 있습니다. Amazon Polly는 MP3, Vorbis 및 원시 PCM 오디오 스트림 형식을 지원합니다.

샘플링 비율 MP3 크기   OGG 크기
PCM 크기
22.05kHz 듣기
19.02kB 19.14kB 해당 사항 없음
16.05kHz 듣기 16.04kB
16.35kB
99.53kB
8.00kHz 듣기 13.26kB 10.40kB 49.76kB

Amazon Polly에서는 음성 합성 애플리케이션을 위한 Speech Synthesis Markup Language(SSML), W3C 표준, XML 기반 마크업 언어를 지원하고 표현, 강조 및 억양을 위한 일반 SSML 태그를 지원합니다. 이러한 유연성은 청중의 관심을 끌 수 있는 생생한 음성을 생성하는 데 도움이 됩니다.

자세한 내용은 SSML 태그에 대한 Amazon Polly 설명서를 참조하십시오.

샘플 SSML
This is how I speak normally. (없음)
I can speak in a higher pitched voice, or I can speak in a lower pitched voice. I can speak in a higher pitched voice , or I can speak in a lower pitched voice
I can speak really slowly, or I can speak really fast. I can speak really slowly , or  I can speak really fast
I can also speak very loudly, or I can speak very quietly. I can also speak very loudly , or I can speak very quietly .
I can whisper. I have a secret to tell you, I will whisper it to you. ' I am not human. Can you believe it?

Amazon Polly에서는 AWS SDK(Java, Node.js, .NET, PHP, Python, Ruby, Go, C++) 및 AWS Mobile SDK(iOS/Android)에 포함된 모든 프로그래밍 언어를 지원합니다. 또한, Polly는 HTTP API를 지원하므로 사용자는 자체 액세스 계층을 구현할 수 있습니다.

Amazon Polly는 Polly API(그리고 다양한 언어별 SDK), AWS Management Console 및 AWS 명령줄 인터페이스(CLI)를 통해 액세스할 수 있습니다. 콘솔, API 또는 CLI 중 어느 것을 통해 서비스를 사용하든 Amazon Polly의 모든 기능을 완벽히 제어할 수 있습니다.

Amazon Polly의 사용자 지정 어휘 또는 용어의 경우 회사 이름, 두문자어, 외래어, 신조어 등 특정 단어의 발음을 수정할 수 있습니다(예: 프랑스인이 아닌 사람이 말할 때 “C’est la vie”, “ROTFL”). 이러한 발음을 사용자 지정하려면 어휘 항목이 포함된 XML 파일을 업로드하면 됩니다. 예를 들어 이 XML을 통해 음소를 제공하여 Nguyen의 발음을 사용자 지정할 수 있습니다.


            Nguyen
            nguyen
            NGUYEN
            "nu.jEn'