Amazon Transcribe로
오디오 트랜스크립트 생성
이 단계별 자습서에서는 AWS Management Console을 통해 Amazon Transcribe를 사용하여 녹음된 오디오 파일의 텍스트 트랜스크립트를 생성하는 방법에 대해 알아볼 것입니다. Amazon Transcribe는 개발자가 음성을 텍스트로 변환하는 기능을 애플리케이션에 쉽게 추가할 수 있게 지원하는 자동 음성 인식(ASR) 서비스입니다. Amazon Transcribe API를 사용하면 Amazon Simple Storage Service(S3)에 저장된 오디오 파일을 분석하고 서비스에서 음성을 기록한 텍스트 파일을 반환하도록 할 수 있습니다.
개발자는 주로 고객 서비스 통화에 대한 트랜스크립션을 생성하거나 오디오 및 비디오 콘텐츠의 자막을 생성할 때 음성을 텍스트로 변환하는 기능이 필요합니다. 이는 처음부터 자신의 기계 학습 모델을 구축하는 것으로 해결할 수 있습니다. 그러나 이 방법은 시간과 비용이 많이 소요되고 기계 학습에 대한 전문성이 필요합니다. 어려운 길을 택하는 대신 Amazon Transcribe(사전 훈련된 완전관리형 서비스)를 사용하면 빠르고 우수한 품질의 트랜스크립션을 제공할 수 있습니다.
이 자습서에서는 샘플 오디오 파일을 다운로드한 다음, 생성한 S3 버킷에 업로드할 것입니다. 그리고 AWS Management Console에서 Amazon Transcribe를 사용하여 샘플 오디오 클립의 트랜스크립트를 생성할 것입니다.
이 자습서는 AWS CLI 또는 Transcribe API를 사용할 때 제공되는 기능의 데모입니다. 제품 또는 개념 증명 구현의 경우, Amazon Transcribe 콘솔보다는 이러한 프로그래밍 방식의 인터페이스를 사용하는 것이 좋습니다.
이 자습서를 사용하려면 AWS 계정이 필요합니다.
Amazon Transcribe 프리 티어에서 손쉽게 시작할 수 있습니다. 매월 60분 분량의 오디오 트랜스크립트가 AWS 계정 등록 후 첫 12개월까지 무료로 제공됩니다.
1단계. S3 버킷 생성 및 샘플 오디오 파일 업로드
이 단계에서는 샘플 오디오 파일을 다운로드하고 S3 버킷을 생성한 다음, 샘플 파일을 S3 버킷에 업로드합니다. Transcribe는 S3 버킷에서만 트랜스크립션을 위한 오디오 및 영상 파일에 액세스합니다.
a. 여기를 클릭하면 자습서에서 나중에 트랜스크립션할 샘플 오디오 파일이 다운로드됩니다. 파일 이름은 transcribe-sample.mp3입니다.
b. 여기를 클릭하면 AWS Management Console이 새 브라우저 창에서 열리므로 이 단계별 안내서를 계속 열어 놓을 수 있습니다. 이 화면이 로드되면 먼저 사용자 이름 및 암호를 입력하여 시작합니다. [리전] 드롭다운에서 Amazon Transcribe가 있는 리전을 선택합니다.
Amazon Transcribe는 현재 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오레곤), 아시아 태평양(시드니), 캐나다(중부) 및 EU(아일랜드) 리전에서 제공됩니다.
e. 고유한 버킷 이름을 입력합니다. 입력하는 버킷 이름은 Amazon S3에 있는 어떤 기존 버킷 이름과도 중복되지 않아야 합니다. S3 버킷 이름에 대한 몇 가지 다른 제약 사항이 있습니다. 그런 다음 버킷을 생성할 리전을 선택합니다.
[다음]을 선택합니다.
2단계. 트랜스크립션 작업 생성
이 단계에서는 Amazon Transcribe 콘솔을 사용하여 트랜스크립션 작업을 생성하고 실행합니다.
d. [트랜스크립션 작업 생성] 페이지의 [이름] 필드에 sample-transcription-job을 입력합니다.
[언어]에서 기본값 [영어]를 그대로 둡니다.
[S3의 입력 파일 위치] 필드에 S3 버킷에 있는 샘플 파일의 링크를 붙여 넣습니다. 사용자의 샘플 파일 링크는 오른쪽 스크린샷에 표시된 것과는 다를 것입니다.
[형식]에서 기본값 [mp3]를 그대로 둡니다.
[사용자 지정 어휘] 기능을 사용하면 Amazon Translate가 해당 개발자의 애플리케이션에만 나오는 단어와 구(예: Etienne과 같이 영어가 아닌 이름)를 인식하는 데 도움이 됩니다. 이 자습서에서는 이 기능을 사용하지 않습니다.
3단계. 트랜스크립션 결과 검토
이 단계에서는 진행 상황을 확인하고 트랜스크립션 작업의 결과를 검토하는 방법을 설명합니다.
4단계. 템플릿 리소스
이 단계에서는 불필요한 요금을 절약하기 위해 S3 버킷에서 샘플 파일을 삭제할 것입니다.
축하합니다!
이 자습서에서 보셨듯이 Amazon Transcribe를 사용하여 음성을 텍스트로 변환하는 작업을 대량으로 처리할 수 있습니다. 고객 서비스 통화, 비즈니스 미팅, TV 방송, 온디맨드 동영상과 같은 다양한 오디오 또는 비디오 파일에 Amazon Transcribe를 사용할 수 있습니다.