사용이 간편한 API

Amazon Polly는 음성 합성을 애플리케이션에 신속하게 통합할 수 있도록 API를 제공합니다. 음성으로 변환하려는 텍스트를 Amazon Polly API로 전송하기만 하면 Amazon Polly가 오디오 스트림을 애플리케이션으로 즉시 반환하므로 애플리케이션이 직접 이를 스트리밍하거나 MP3와 같은 표준 오디오 파일 형식으로 저장할 수 있습니다.

샘플링 비율 샘플 코드
"Hi. My name is Joanna." from boto3 import client
polly = client("polly", region_name="us-east-1")
response = polly.synthesize_speech(
        Text="Hi. My name is Joanna.",
        OutputFormat="mp3",
        VoiceId="Joanna")

다양한 목소리 및 언어 선택

Amazon Polly에는 수십 개의 생생한 음성과 다양한 언어에 대한 지원이 포함되어 있으므로 많은 국가에서 적합한 목소리를 선택하여 음성 지원 애플리케이션을 배포할 수 있습니다.

언어 여성
남성
호주 영어 Nicole Russell
브라질식 포르투갈어 Vitória Ricardo
캐나다 프랑스어 Chantal  
덴마크어 Naja Mads
네덜란드어 Lotte Ruben
프랑스어

Léa

Céline

Mathieu

 

독일어 Vicki Hans
  Marlene  
아이슬란드어 Dóra Karl
인도 영어

Raveena

Aditi

 
이탈리아어 Carla Giorgio
일본어 Mizuki Takumi
한국어 Seoyeon  
노르웨이어 Liv  
폴란드어 Ewa Jacek
  Maja Jan
이베리아식 포르투갈어 Inês Cristiano
루마니아어 Carmen  
러시아어 Tatyana Maxim
카스티야 스페인어 Conchita Enrique
스웨덴어 Astrid  
터키어 Filiz  
영국 영어 Amy Brian
  Emma  
미국 영어 Joanna Matthew
  Salli Justin
  Kendra Joey
  Kimberly  
  Ivy  
미국 스페인어 Penélope Miguel
웨일스어 Gwyneth  
웨일스 영어   Geraint

향상된 시각적 경험을 위해 음성 동기화

Amazon Polly에서는 특정 문장, 단어 또는 소리가 발음되는 시점에 대한 정보를 제공하는 메타데이터의 추가 스트림을 손쉽게 요청할 수 있습니다. 합성된 음성 오디오 스트림과 함께 이러한 메타데이터 스트림을 사용하면 이제 음성이 동기화된 얼굴 애니메이션 또는 노래방 형태의 자막 강조 표시와 같은 향상된 시각적 경험이 적용된 애플리케이션을 구축할 수 있습니다.

인용 부호 기능을 사용하는 방법을 자세히 알아보려면 설명서로 이동하십시오. 

스트리밍 오디오 최적화

Amazon Polly에서는 애플리케이션을 통해 사용자에게로 모든 종류의 정보를 거의 실시간으로 스트리밍할 수 있습니다. 또한, 다양한 샘플링 비율에서 선택하여 애플리케이션의 대역폭과 오디오 품질을 최적화할 수 있습니다. Amazon Polly는 MP3, Vorbis 및 원시 PCM 오디오 스트림 형식을 지원합니다.

샘플링 비율 MP3 크기   OGG 크기
PCM 크기
22.05kHz 듣기
19.02kB 19.14kB 해당 사항 없음
16.05kHz 듣기 16.04kB
16.35kB
99.53kB
8.00kHz 듣기 13.26kB 10.40kB 49.76kB

말하는 속도, 높이 및 음량 조정

Amazon Polly에서는 음성 합성 애플리케이션을 위한 Speech Synthesis Markup Language(SSML), W3C 표준, XML 기반 마크업 언어를 지원하고 표현, 강조 및 억양을 위한 일반 SSML 태그를 지원합니다. 이러한 유연성은 청중의 관심을 끌 수 있는 생생한 음성을 생성하는 데 도움이 됩니다.

자세한 내용은 Amazon Polly의 SSML 태그 섹션을 참조하십시오.

샘플 SSML
This is how I speak normally. (없음)
I can speak in a higher pitched voice, or I can speak in a lower pitched voice. I can speak in a higher pitched voice , or I can speak in a lower pitched voice
I can speak really slowly, or I can speak really fast. I can speak really slowly , or  I can speak really fast
I can also speak very loudly, or I can speak very quietly. I can also speak very loudly , or I can speak very quietly .
I can whisper. I have a secret to tell you, I will whisper it to you. ' I am not human. Can you believe it?

플랫폼 및 프로그래밍 언어 지원

Amazon Polly에서는 AWS SDK(Java, Node.js, .NET, PHP, Python, Ruby, Go, C++) 및 AWS Mobile SDK(iOS/Android)에 포함된 모든 프로그래밍 언어를 지원합니다. 또한, Polly는 HTTP API를 지원하므로 사용자는 자체 액세스 계층을 구현할 수 있습니다.

API, 콘솔 또는 명령줄을 통한 음성 합성

Amazon Polly는 Polly API(그리고 다양한 언어별 SDK), AWS Management Console 및 AWS 명령줄 인터페이스(CLI)를 통해 액세스할 수 있습니다. 콘솔, API 또는 CLI 중 어느 것을 통해 서비스를 사용하든 Amazon Polly의 모든 기능을 완벽히 제어할 수 있습니다.

사용자 지정 어휘

Amazon Polly의 사용자 지정 어휘 또는 용어의 경우 회사 이름, 두문자어, 외래어, 신조어 등 특정 단어의 발음을 수정할 수 있습니다(예: 프랑스인이 아닌 사람이 말할 때 “C’est la vie”, “ROTFL”). 이러한 발음을 사용자 지정하려면 어휘 항목이 포함된 XML 파일을 업로드하면 됩니다. 예를 들어 이 XML을 통해 음소를 제공하여 Nguyen의 발음을 사용자 지정할 수 있습니다.


            Nguyen
            nguyen
            NGUYEN
            "nu.jEn'

Amazon Polly 요금에 대해 자세히 알아보기

요금 페이지로 이동하기
시작할 준비가 되셨습니까?
가입
질문이 있으십니까?
문의하기