Amazon Polly 사용해 보기

무료 계정에 가입
또는 콘솔에 로그인

Amazon Polly 프리 티어는 첫 번째 음성 요청부터 시작해 첫 12개월 동안 매월 500만 자의 글자를 포함합니다.

AWS 프리 티어 세부 정보 보기 »


Q: Amazon Polly란 무엇입니까?

Amazon Polly는 텍스트를 생생한 음성으로 변환하는 서비스입니다. Amazon Polly는 기존 애플리케이션이 1급 기능으로 말을 할 수 있도록 지원하고, 모바일 앱과 차량에서 디바이스와 어플라이언스에 이르기까지 전혀 새로운 종류의 음성 지원 제품을 만들 수 있는 기회를 제공합니다. Amazon Polly에는 여러 언어로 수십 개의 생생한 음성이 포함되어 있으므로 적합한 음성을 선택하여 다양한 지역에 음성 지원 애플리케이션을 배포할 수 있습니다. Amazon Polly는 사용이 간편합니다. 음성으로 변환하려는 텍스트를 Amazon Polly API로 전송하기만 하면, Amazon Polly가 즉시 오디오 스트림을 애플리케이션으로 반환하므로 바로 재생하거나 MP3와 같은 표준 오디오 파일 형식으로 저장할 수 있습니다. Amazon Polly는 prosody처럼 SSML(Speech Synthesis Markup Language) 태그를 지원하므로 말하는 속도, 높이 또는 음량을 조정할 수 있습니다. Amazon Polly는 이 모든 장점을 짧은 지연 시간과 큰 규모로 제공하는 안전한 서비스입니다. 사용자는 Amazon Polly가 생성한 음성을 추가 비용 없이 캐시하고 재생할 수 있습니다. Amazon Polly를 사용하면 가입 후 처음 1년 동안 매달 5백만 개의 문자를 무료로 변환할 수 있습니다. Amazon Polly의 사용량에 따라 지불하는 요금제, 저렴한 요청당 비용, 자유로운 스토리지 및 음성 출력 재사용 기능을 통해 어디서나 비용 효율적인 방법으로 손쉽게 음성 합성을 지원할 수 있습니다.

Q: Amazon Polly를 사용해야 하는 이유는 무엇입니까?

Amazon Polly를 사용해 고품질 음성 출력으로 애플리케이션을 지원할 수 있습니다. 이 비용 효율적인 서비스는 응답 시간이 매우 짧고, 사실상 모든 사용 사례에서 사용할 수 있으며, 스토리지와 생성된 음성 재사용에 대한 제한이 없습니다.

Q: 어떤 기능을 사용할 수 있습니까?

표준 Speech Synthesis Markup Language(SSML)를 사용하여 발음, 볼륨, 높이, 말하는 속도 등 음성의 다양한 부분을 제어할 수 있습니다. 오디오 스트림에 포함된 메타데이터를 기반으로 언제 사용자에게 텍스트에 있는 특정 단어 또는 문장을 말하는지 탐지할 수 있습니다. 이를 통해 개발자는 아바타의 입술 움직임과 같은 애니메이션과 그래픽 강조 표시를 합성된 음성과 동기화할 수 있습니다. 사용자 지정 어휘를 사용하여 회사 이름, 두문자어, 외래어, 신조어 등 특정 단어의 발음, 예를 들어 "P!nk", "ROTFL", "C’est la vie"(프랑스인이 아닌 사람이 말할 때)와 같은 발음을 수정할 수 있습니다.

Q: 인용 부호란 무엇입니까?

인용 부호는 입력 텍스트에서 생성되는 합성된 음성을 보완하기 위해 설계되었습니다. 합성된 음성 오디오 스트림과 함께 이러한 메타데이터를 사용하면 고객이 음성이 동기화된 애니메이션이나 노래방 형태의 강조 표시와 같이 향상된 시각적 경험이 적용된 애플리케이션을 제공할 수 있습니다.

Amazon Polly는 다음과 같은 4가지 요소를 사용하여 인용 부호를 생성합니다.

1) 문장: 입력 텍스트에서 말로 해야 하는 문장 요소를 나타냅니다.

2) 단어: 텍스트에서 단어 요소를 나타냅니다.

3) 비짐: 말로 들리는 소리에 대응되는 입술 모양을 설명합니다.

4) SSML: 텍스트에서 사용된 SSML 요소를 설명합니다.

음성 합성 메서드를 speech-mark-types 파라미터와 함께 사용하면 이러한 요소를 1개에서 4개 모두 포함한 JSON 스트림 형태(독립형 JSON 객체 세트가 줄 바꿈으로 분리됨)로 인용 부호가 제공됩니다. 자세한 내용은 Amazon Polly Developer Guide를 참조하십시오.

Q: 이 서비스에서 가장 일반적인 사용 사례는 무엇입니까?

Amazon Polly에서는 생생한 음성 기능을 추가하여 애플리케이션에 생기를 불어넣을 수 있습니다. 예를 들어 온라인 학습 및 교육 분야에서 Amazon Polly의 텍스트 음성 변환(TTS) 기능을 활용하여 애플리케이션을 구축하면 읽기장애가 있는 사람을 도울 수 있습니다. Amazon Polly는 시각 장애인이 디지털 콘텐츠(전자책, 뉴스 등)를 사용하도록 지원하는 데 사용될 수 있습니다. Amazon Polly는 대중교통의 알림 시스템과 산업 제어 시스템에서 안내와 비상 상황 공지에 사용될 수 있습니다. 셋톱 박스, 스마트 시계, 태블릿, 스마트폰, IoT 디바이스와 같이 다양한 디바이스에서 Amazon Polly를 활용하여 오디오 출력을 제공할 수 있습니다. Amazon Polly는 전화 통신 솔루션에서 대화형 음성 응답 시스템을 지원하는 데 사용될 수 있습니다. Amazon Polly와 같은 클라우드 기반 TTS 솔루션의 일반 사용 사례로는 퀴즈 게임, 애니메이션, 아바타 또는 내레이션 생성과 같은 애플리케이션을 들 수 있습니다.

Q: 이 제품은 다른 AWS 서비스와 어떻게 연동됩니까?

Amazon Lex와 통합하는 경우 개발자가 자사 애플리케이션에 모든 기능을 갖춘 음성 사용자 인터페이스를 생성할 수 있습니다. 클라우드 기반 콜센터 서비스인 Amazon Connect와 함께 사용하는 경우 Amazon Polly 음성 기능을 사용하여 셀프 서비스를 생성할 수 있습니다. 그뿐만 아니라 모바일 애플리케이션 및 사물 인터넷(IoT) 솔루션 개발자는 Amazon Polly를 활용하여 자체 시스템에 음성 출력 기능을 추가할 수 있습니다.

Q: 디바이스 기반 TT 솔루션과 비교하여 클라우드 기반 TTS 솔루션의 장점을 무엇입니까?

디바이스 기반 TTS 솔루션은 상당한 컴퓨팅 리소스, 특히 CPU 파워, RAM 및 디스크 공간을 디바이스에서 제공할 수 있어야 합니다. 이에 따라 개발 비용이 높아지고 태블릿이나 스마트폰과 같은 디바이스의 전력 소모가 커지게 됩니다. 반면에 클라우드에서 수행되는 TTS 변환은 로컬 리소스 요구 사항을 줄여 줍니다. 이를 통해 제공되는 모든 언어와 음성을 최고의 품질로 지원할 수 있게 됩니다. 또한, 언어 교정 및 향상 기능을 모든 최종 사용자에게 즉시 제공할 수 있고 각 디바이스에서 추가로 업데이트할 필요가 없습니다. 클라우드 기반 텍스트 음성 변환(TTS)은 플랫폼 독립적이므로 개발 시간과 노력을 최소화할 수 있습니다.

Q: Amazon Polly를 시작하려면 어떻게 해야 합니까?

AWS 계정에 로그인하고 Amazon Polly 콘솔(AWS 콘솔의 한 부분)로 이동합니다. 그런 다음 콘솔을 사용하여 아무 텍스트나 입력하고 생성된 음성을 듣거나 오디오 파일로 저장합니다.

Q: 어느 리전에서 이 서비스를 사용할 수 있습니까?

Amazon Polly는 전 세계 14개 AWS 리전, 즉 아시아 태평양(뭄바이), 아시아 태평양(서울), 아시아 태평양(싱가포르), 아시아 태평양(시드니), 아시아 태평양(도쿄), 캐나다(중부), EU(프랑크푸르트), EU(아일랜드), EU(런던), 남아메리카(상파울루), 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(캘리포니아 북부), 미국 서부(오레곤) 리전에서 액세스할 수 있습니다.

Q: 지원되는 프로그래밍 언어는 무엇입니까?

Amazon Polly는 AWS SDK(Java, Node.js, .NET, PHP, Python, Ruby, Go 및 C++)와 AWS Mobile SDK(iOS/Android)를 비롯하여 모든 프로그래밍 언어를 지원합니다. 또한, Amazon Polly는 HTTP API를 지원하므로 고객은 자체 액세스 계층을 구현할 수 있습니다.

Q: 지원되는 오디오 형식은 무엇입니까?

Amazon Polly에서는 거의 실시간으로 사용자에게 오디오를 스트리밍할 수 있습니다. 또한, 다양한 샘플링 비율을 선택하여 애플리케이션의 대역폭과 오디오 품질을 최적화할 수 있습니다. Amazon Polly는 MP3, Vorbis 및 원시 PCM 오디오 스트림 형식을 지원합니다.

Q: 지원되는 언어는 무엇입니까?

영어(미국) 네덜란드어 한국어 스페인어(미국)
영어(호주) 프랑스어 폴란드어 스웨덴어
영어(영국) 프랑스어(캐나다)
포르투갈어 터키어
영어(인도) 독일어 포르투갈어(브라질)
노르웨이어
영어(웨일스) 아이슬란드어 루마니아어  
웨일스어 이탈리아어 러시아어
  
덴마크어 일본어 스페인어(카스티야)
 

Q: Amazon Polly는 AWS 서비스 제한이 있습니까?

AWS는 AWS 리소스의 가용성을 보장하는 동시에 신규 고객의 결제 리스크를 최소화할 목적으로 각 계정마다 서비스 제한을 유지하고 있습니다. Amazon Polly를 사용하여 고품질의 음성 출력 기능을 애플리케이션에 탑재할 경우에는 스로틀링 및 작업 횟수와 SSML(Speech Synthesis Markup Language) 사용에 대한 제한을 포함하여 기본적인 서비스 제한이 있습니다. 자세한 내용은 Amazon Polly 개발자 가이드에서 Amazon Polly의 서비스 제한을 참조하십시오. 효율적인 배치 처리를 지원하는 AWS Batch와 같이 다른 AWS 서비스와 함께 Amazon Polly를 사용하면 서비스 제한 내에서 Amazon Polly를 최대한 활용할 수 있습니다.


Q: Amazon Polly의 사용료는 얼마입니까?

최신 요금 정보는 Amazon Polly 요금 페이지를 참조하십시오.

Q: 여러 번 재생될 정적 음성 프롬프트를 생성하는 데 이 서비스를 사용할 수 있습니까?

예. 가능합니다. 이 서비스는 해당 기능을 제한하지 않으며 추가 비용 없이 진행할 수 있습니다.

Q: 알림 시스템(예를 들어 기차역)에서 사용할 콘텐츠를 생성하는 데 이 서비스를 사용할 수 있습니까?

예. 가능합니다. 이 서비스는 해당 기능을 제한하지 않으며 추가 비용 없이 진행할 수 있습니다.

Q: 1,000개의 문자를 합성하도록 요청하고 같은 1,000개의 문자에 인용 부호를 적용하도록 요청하면, 2,000개의 문자에 대한 비용이 부과됩니까?

예. 음성 또는 인용 부호에 대한 모든 요청은 서비스로 전송하는 문자 수를 기준으로 요금이 부과됩니다.

Q: Amazon Polly는 AWS 프리 티어에 포함됩니까?

예. AWS 프리 티어를 사용하는 고객은 Amazon Polly를 무료로 시작할 수 있습니다. 가입하는 신규 Amazon Polly 고객은 처음 12개월 동안 매달 최대 5백만 개의 문자를 무료로 합성할 수 있습니다.

Q: 요금에 세금이 포함되어 있습니까?

세금에 대한 자세한 내용은 Amazon Web Services 세금 도움말 페이지를 참조하십시오.


Q: Amazon Polly는 서비스를 개선하는 데 내 콘텐츠를 사용합니까? Amazon Polly에 대한 AWS의 프라이버시 정책이 어떻게 됩니까?

Amazon Polly에서는 서비스 상품과 AWS 및 제휴사가 제공하는 다른 기계 학습 관련 제품 및 서비스의 품질을 개선하는 데 고객의 콘텐츠를 사용할 수 있습니다. 고객 콘텐츠의 사용은 해당 기술을 더욱 발전시키고 Amazon Polly 고객 경험을 개선하는 데 매우 중요합니다. AWS에서는 고객의 신뢰, 개인 정보, 콘텐츠의 보안을 최우선으로 하고 있으며 콘텐츠에 대한 무단 액세스 또는 유출을 방지하기 위해 정교하고 책임 있는 기술적 및 물리적 제어를 구현하고 고객과의 약속을 충실히 준수합니다. 자세한 내용은 AWS 데이터 프라이버시 FAQ를 참조하십시오.