Amazon Web Services 한국 블로그

Amazon Polly 기반 블로그 음성 읽기 WordPress 플러그인 공개

Amazon Polly에 대해서는 2016년말 출시 소개 이후 지난 AWS re:Invent 출시 이후 한국어와 5가지의 새로운 음성이 추가되었으며 Polly가 aws 파티션의 모든 리전에서 사용할 수 있게 되었습니다. 또한 속삭임, 음성 표식, 음색 효과동적 범위 압축 기능도 추가되었습니다.

신규 WordPress 플러그인
오늘 Polly를 사용하여 블로그 게시물의 고품질 오디오 버전을 생성하는 WordPress 플러그인을 출시합니다. 사용자는 게시물 내에서 또는 팟캐스트 서식에서 Amazon Pollycast라는 기능을 사용하여 오디오를 액세스할 수 있습니다! 두 옵션 모두 콘텐츠의 접근성을 향상하여 다 많은 청중에게 도달할 수 있게 해 줍니다. 이 플러그인은 AWS 팀과 AWS 어드밴스 기술 파트너인 WP Engine의 공동 노력을 통해 탄생했습니다.

보면 아시겠지만 이 플러그인은 설치와 구성이 간편하며 고객 자체의 인프라 또는 AWS에서 실행되는 WordPress의 설치 환경에서 사용할 수 있습니다. 두 경우 모두 Polly의 모든 음성을 액세스할 수 있으며 다양한 구성 옵션이 함께 제공됩니다. 생성된 오디오(각 게시물 당 하나의 MP3 파일 생성)는 WordPress 콘텐츠와 함께 저장하거나 Amazon Simple Storage Service(S3)에 저장할 수 있으며 선택적으로 Amazon CloudFront를 통한 콘텐츠 배포가 지원됩니다.

플러그인 설치
신규로 WordPress 4.8.1 블루프린트를 사용하여 Lightsail 인스턴스를 시작합니다.

그런 다음 지침을 따라 로그인 자격 증명을 액세스합니다.

자격 증명을 가지고 WordPress 대시보드에 로그인합니다.

플러그인은 AWS를 호출할 때 자격 증명을 필요로 합니다. IAM 콘솔로 이동하여 새 정책을 생성합니다. 이 정책은 플러그인에서 조심스럽게 선별된 S3 및 Polly 함수 집합에 액세스할 수 있게 해 줍니다(README의 전체 정책 참조).

그런 다음 IAM 사용자(wp-polly-user)를 생성합니다. 이름을 입력하고 프로그램적 액세스에 사용될 것임을 표시합니다.

그런 다음 방금 생성한 정책을 첨부하고 검토를 클릭합니다.

설정을 검토(본 이미지에 표시 안 됨)했으면 사용자 생성을 클릭합니다. 그런 다음 두 개의 값(액세스 키 ID 및 비밀 액세스 키)를 안전한 위치로 복사합니다. 이 두 키를 가진 사용자는 AWS를 호출할 수 있으므로 관리에 유의하시기 바랍니다.

이제 플러그인을 설치할 준비가 되었습니다! WordPress 대시보드로 돌아가 플러그인 메뉴에서 새로 추가를 클릭합니다.

그런 다음 플러그인 업로드를 클릭하고 WordPress 플러그인 사이트로부터 다운로드한 ZIP 파일을 찾습니다. 파일을 찾았으면 지금 설치를 클릭하여 계속합니다.

WordPress가 플러그인을 업로드 및 설치합니다. 이제 플러그인 활성화를 클릭하여 계속 진행합니다.

플러그인이 설치되었으면 설정을 클릭하여 설정을 구성합니다.

키를 입력하고 변경 사항 저장을 클릭합니다.

일반 설정을 사용하면 샘플링 속도, 플레이어 위치, 새 게시물의 기본 설정 및 자동 재성 옵션을 제어할 수 있습니다. 모든 설정을 그대로 두고 시작합니다.

클라우드 스토리지 설정을 사용하면 S3에서 오디오를 저장하고 CloudFront를 사용하여 해당 오디오를 배포할 수 있습니다.

Amazon Pollycast 설정을 사용하면 생성된 RSS 피드에 포함된 iTunes 파라미터를 제어할 수 있습니다.

마지막으로 대량 업데이트 버튼을 사용하면 다른 모든 설정을 변경한 후 모든 오디오 파일을 다시 생성할 수 있습니다.

플러그인의 설치와 구성이 완료되었으면 새 게시물을 생성할 수 있습니다. 그림과 같이 각 게시물에 대해 플러그인을 활성화 및 사용자 지정할 수 있습니다.

클릭 한 번으로 오디오를 변환할 때 요금이 얼마가 될 지를 볼 수 있습니다.

게시를 클릭하면 플러그인이 텍스트를 문장 경계에 따라 여러 개의 블록으로 분해하고, 각 블록에 대해 Polly SynthesizeSpeech API를 호출하고, 이렇게 생성된 오디오를 단일 MP3 파일로 결합합니다. 게시된 블로그 게시물은 <audio> 태그를 사용하여 파일을 참조합니다. 게시물은 다음과 같습니다.

이 게시물에서는 <audio> 태그를 사용할 수 없으나 여러분은 원하는 경우 MP3 파일을 직접 다운로드하여 재생하실 수 있습니다.

Pollycast 기능은 각 게시물에 대한 MP3 파일에 대한 링크를 포함하는 RSS 파일을 생성합니다.

요금
플러그인은 게시물이 저장 또는 업데이트될 때마다 Amazon Polly를 호출합니다. 요금은 Polly 요금 페이지에 설명된 대로 음성 요청의 문자 수에 기반합니다. 또한 AWS 프리 티어를 사용하면 Polly에 대한 최초 호출이 제출된 시점부터 1년 동안 매달 최대 5백만 자를 별도 요금 없이 처리할 수 있습니다.

추가 정보
이 플러그인은 GitHub에서 소스 코드 형태로 사용할 수 있으니 많은 풀 요청을 생성해 보시기 바랍니다! 다음은 시작을 위한 몇 가지 아이디어입니다.

  • 저자별 음성 – 각 저자를 위한 독특한 Polly 음성을 선택할 수 있습니다.
  • 인용 텍스트 – 인용문을 자주 포함하는 블로그의 경우 인용문에 독특한 음성을 적용할 수 있습니다.
  • 번역Amazon Translate를 사용하여 텍스트를 다른 언어로 번경한 다음 Poll를 사용하여 해당 언어로 된 오디오를 생성할 수 있습니다.
  • 기타 블로깅 엔진 – 즐겨 사용하는 블로깅 엔진을 위한 유사한 플러그인을 제작할 수 있습니다.
  • SSML 지원 – Polly의 SSML 태그를 흥미로운 방식으로 사용하여 개성 있는 오디오를 제작하는 방법을 알아 보십시오.

한국어 음성을 통해 여러분의 블로그에 적용한 멋진 결과가 있으면 알려 주시기 바랍니다!

Jeff;