게시된 날짜: Mar 22, 2018

Amazon Polly는 고급 딥 러닝 기술을 사용하여 실제 사람 목소리처럼 음성을 합성하는 텍스트 음성 변환 서비스입니다. 새로운 SSML 호흡 기능은 일반적인 음성을 낼 때 들숨과 날숨의 소리를 흉내냅니다. 이제 SSML 호흡 태그를 사용하면 적절한 호흡 소리를 삽입하여 Amazon Polly에서 생성된 음성이 사람이 글을 읽는 것처럼 더욱 자연스러워지도록 구현할 수 있습니다.

태그를 사용하거나 두 태그의 조합을 사용하여 음성 출력에 호흡 소리를 추가할 수 있습니다.

  • 자동 모드: Amazon Polly가 사용자 입력 없이 음성 출력에 자동으로 호흡 소리를 삽입하여 정상적인 호흡을 시뮬레이션합니다. (이러한 간격의 주기뿐 아니라 볼륨과 길이를 설정할 수도 있습니다.)
  • 수동 모드: 텍스트에 대한 호흡 소리의 위치, 길이 및 볼륨을 수동으로 설정합니다.
  • 혼합 모드: 사용자가 삽입한 사용자 지정 호흡 소리와 Amazon Polly에서 자동으로 삽입한 소리가 조합됩니다.

텍스트 음성 출력에 호흡 소리를 적용함으로써 Amazon Polly는 특히 긴 텍스트를 음성으로 변환할 때 더욱 자연스러운 음성을 제공합니다. 

Amazon Polly 콘솔에 로그인하여 SSML 호흡 기능을 사용해 보거나 Amazon Polly 설명서에서 SSML 태그에 대한 자세한 내용을 확인하십시오.