Amazon Transcribe로

오디오 트랜스크립트 생성

이 단계별 자습서에서는 AWS Management Console을 통해 Amazon Transcribe를 사용하여 녹음된 오디오 파일의 텍스트 트랜스크립트를 생성하는 방법에 대해 알아볼 것입니다. Amazon Transcribe는 개발자가 음성을 텍스트로 변환하는 기능을 애플리케이션에 쉽게 추가할 수 있게 지원하는 자동 음성 인식(ASR) 서비스입니다. Amazon Transcribe API를 사용하면 Amazon Simple Storage Service(S3)에 저장된 오디오 파일을 분석하고 서비스에서 음성을 기록한 텍스트 파일을 반환하도록 할 수 있습니다.

개발자는 주로 고객 서비스 통화에 대한 트랜스크립션을 생성하거나 오디오 및 비디오 콘텐츠의 자막을 생성할 때 음성을 텍스트로 변환하는 기능이 필요합니다. 이는 처음부터 자신의 기계 학습 모델을 구축하는 것으로 해결할 수 있습니다. 그러나 이 방법은 시간과 비용이 많이 소요되고 기계 학습에 대한 전문성이 필요합니다. 어려운 길을 택하는 대신 Amazon Transcribe(사전 훈련된 완전관리형 서비스)를 사용하면 빠르고 우수한 품질의 트랜스크립션을 제공할 수 있습니다.

이 자습서에서는 샘플 오디오 파일을 다운로드한 다음, 생성한 S3 버킷에 업로드할 것입니다. 그리고 AWS Management Console에서 Amazon Transcribe를 사용하여 샘플 오디오 클립의 트랜스크립트를 생성할 것입니다.

이 자습서는 AWS CLI 또는 Transcribe API를 사용할 때 제공되는 기능의 데모입니다. 제품 또는 개념 증명 구현의 경우, Amazon Transcribe 콘솔보다는 이러한 프로그래밍 방식의 인터페이스를 사용하는 것이 좋습니다.

이 자습서를 사용하려면 AWS 계정이 필요합니다.

Amazon Transcribe 프리 티어에서 손쉽게 시작할 수 있습니다. 매월 60분 분량의 오디오 트랜스크립트가 AWS 계정 등록 후 첫 12개월까지 무료로 제공됩니다.

프리 티어에 대해 자세히 알아보기 >>


1단계. S3 버킷 생성 및 샘플 오디오 파일 업로드

이 단계에서는 샘플 오디오 파일을 다운로드하고 S3 버킷을 생성한 다음, 샘플 파일을 S3 버킷에 업로드합니다. Transcribe는 S3 버킷에서만 트랜스크립션을 위한 오디오 및 영상 파일에 액세스합니다.


a.  여기를 클릭하면 자습서에서 나중에 트랜스크립션할 샘플 오디오 파일이 다운로드됩니다. 파일 이름은 transcribe-sample.mp3입니다.


b.  여기를 클릭하면 AWS Management Console이 새 브라우저 창에서 열리므로 이 단계별 안내서를 계속 열어 놓을 수 있습니다. 이 화면이 로드되면 먼저 사용자 이름 및 암호를 입력하여 시작합니다. [리전] 드롭다운에서 Amazon Transcribe가 있는 리전을 선택합니다.

Amazon Transcribe는 현재 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오레곤), 아시아 태평양(시드니), 캐나다(중부) 및 EU(아일랜드) 리전에서 제공됩니다.

create-audio-transcript-transcribe-step-1b
create-audio-transcript-transcribe-step-1b

( 확대하려면 클릭 )


c. 검색창에 S3를 입력하고 S3를 선택하여 콘솔을 엽니다.

create-audio-transcript-transcribe-step-1c
create-audio-transcript-transcribe-step-1c

( 확대하려면 클릭 )


d.  S3 대시보드에서 [버킷 생성]을 클릭합니다.

버킷을 처음 생성하는 경우, 여기에 나온 이미지와 비슷한 화면이 표시됩니다.

이미 S3 버킷을 생성했다면, S3 대시보드에 생성한 모든 버킷이 나열됩니다.

create-audio-transcript-transcribe-step-1d
create-audio-transcript-transcribe-step-1d

( 확대하려면 클릭 )


e.  고유한 버킷 이름을 입력합니다. 입력하는 버킷 이름은 Amazon S3에 있는 어떤 기존 버킷 이름과도 중복되지 않아야 합니다. S3 버킷 이름에 대한 몇 가지 다른 제약 사항이 있습니다. 그런 다음 버킷을 생성할 리전을 선택합니다.

[다음]을 선택합니다.

create-audio-transcript-transcribe-step-1e
create-audio-transcript-transcribe-step-1e

( 확대하려면 클릭 )


f.  [버전 관리], [서버 액세스 로깅], [태그], [객체 수준 로깅], [기본 암호화]를 비롯하여 S3 버킷과 관련된 많은 유용한 옵션이 있습니다. 이 자습서에서는 이러한 기능을 활성화하지 않습니다.

[다음]을 선택합니다.

create-audio-transcript-transcribe-step-1f
create-audio-transcript-transcribe-step-1f

( 확대하려면 클릭 )


g.  이 단계에서는 S3 버킷 생성 프로세스에서 S3 버킷의 권한 설정을 조정하는 방법을 배우게 됩니다.

기본값을 그대로 두고 [다음]을 선택합니다.

create-audio-transcript-transcribe-step-1g
create-audio-transcript-transcribe-step-1g

( 확대하려면 클릭 )


h.  구성 설정을 확인하고 [버킷 생성]을 선택합니다.

create-audio-transcript-transcribe-step-1h
create-audio-transcript-transcribe-step-1h

( 확대하려면 클릭 )


i.  S3 콘솔에 새로운 버킷이 표시됩니다. 버킷의 이름을 클릭하여 버킷으로 이동합니다. 버킷 이름은 오른쪽 스크린샷에 표시되는 것과 동일하지 않습니다.

create-audio-transcript-transcribe-step-1i
create-audio-transcript-transcribe-step-1i

( 확대하려면 클릭 )


j. 버킷의 홈페이지로 이동했습니다.

[업로드]를 선택합니다.

create-audio-transcript-transcribe-step-1j
create-audio-transcript-transcribe-step-1j

( 확대하려면 클릭 )


k.  [파일 추가]를 선택하고 transcribe-sample.mp3 파일을 선택하거나 이 파일을 업로드 상자로 끌어 오는 방법으로 transcribe-sample.mp3 파일을 업로드합니다.

[업로드]를 선택합니다.

create-audio-transcript-transcribe-step-1k
create-audio-transcript-transcribe-step-1k

( 확대하려면 클릭 )


l.  버킷에서 transcribe-sample.mp3 파일 옆의 확인란을 선택합니다. transcribe-sample.mp3 파일의 파일 세부 사항 창이 표시됩니다. 파일 링크를 복사하여 나중에 자습서에서 사용할 수 있도록 저장합니다.

create-audio-transcript-transcribe-step-1l
create-audio-transcript-transcribe-step-1l

( 확대하려면 클릭 )


2단계. 트랜스크립션 작업 생성

이 단계에서는 Amazon Transcribe 콘솔을 사용하여 트랜스크립션 작업을 생성하고 실행합니다.


a.  상단 메뉴 모음에서 [서비스]를 선택한 다음, 검색창에 Transcribe를 입력하고 Amazon Transcribe를 선택하여 서비스 콘솔을 엽니다.

create-audio-transcript-transcribe-step-2a
create-audio-transcript-transcribe-step-2a

( 확대하려면 클릭 )


b.  Amazon Transcribe 콘솔 메인 페이지에서 탐색 창을 열고 [트랜스크립션 작업]을 클릭합니다.

c. [트랜스크립션 작업] 페이지에서 [작업 생성]을 클릭합니다.

create-audio-transcript-transcribe-step-2b
create-audio-transcript-transcribe-step-2b

( 확대하려면 클릭 )


d.  [트랜스크립션 작업 생성] 페이지의 [이름] 필드에 sample-transcription-job을 입력합니다.

[언어]에서 기본값 [영어]를 그대로 둡니다.

[S3의 입력 파일 위치] 필드에 S3 버킷에 있는 샘플 파일의 링크를 붙여 넣습니다. 사용자의 샘플 파일 링크는 오른쪽 스크린샷에 표시된 것과는 다를 것입니다.  

[형식]에서 기본값 [mp3]를 그대로 둡니다.

[사용자 지정 어휘] 기능을 사용하면 Amazon Translate가 해당 개발자의 애플리케이션에만 나오는 단어와 구(예: Etienne과 같이 영어가 아닌 이름)를 인식하는 데 도움이 됩니다. 이 자습서에서는 이 기능을 사용하지 않습니다.

create-audio-transcript-transcribe-step-2c
create-audio-transcript-transcribe-step-2c

( 확대하려면 클릭 )


e.  [데이터 위치]에서 기본값 [Amazon 기본값]을 그대로 둡니다.

[채널 식별]을 선택하면 Amazon Transcribe가 각 화자가 다른 채널로 녹음된 오디오를 처리하고 채널 레이블 주석이 달린 단일 트랜스크립트를 작성할 수 있습니다.

[화자 식별]을 선택하면 Amazon Transcribe가 화자가 바뀌는 것을 인식하고 트랜스크립션된 텍스트에 적절히 반영할 수 있습니다.

이 자습서에서는 이 두 옵션을 모두 사용하지 않습니다.

[생성]을 선택하여 트랜스크립션 작업을 시작합니다.  

create-audio-transcript-transcribe-step-2d
create-audio-transcript-transcribe-step-2d

( 확대하려면 클릭 )


3단계. 트랜스크립션 결과 검토

이 단계에서는 진행 상황을 확인하고 트랜스크립션 작업의 결과를 검토하는 방법을 설명합니다.


a.  [생성] 버튼을 클릭하면 트랜스크립션 작업 화면으로 이동됩니다. sample-transcription-job의 상태가 표시됩니다. 상태는 진행 중, 완료 또는 실패일 수 있습니다.

완료 상태인 경우 [이름] 열에서 sample-transcription-job 링크를 클릭하여 트랜스크립션 결과를 확인합니다.

create-audio-transcript-transcribe-step-3a
create-audio-transcript-transcribe-step-3a

( 확대하려면 클릭 )


b.   이제 sample-transcription-job 세부 사항이 표시됩니다. 트랜스크립션 창으로 스크롤을 내려서 트랜스크립션 작업 출력을 확인합니다. 트랜스크립션 결과는 Transcribe API 또는 AWS CLI에서 반환되므로 JSON 창에서 해당 결과를 볼 수 있습니다.

create-audio-transcript-transcribe-step-3b
create-audio-transcript-transcribe-step-3b

( 확대하려면 클릭 )


4단계. 템플릿 리소스

이 단계에서는 불필요한 요금을 절약하기 위해 S3 버킷에서 샘플 파일을 삭제할 것입니다.


a.  이 상단 탐색 메뉴에서 [서비스]를 클릭한 다음, 검색창에서 S3를 입력하기 시작하고 S3를 선택하여 콘솔을 엽니다.

create-audio-transcript-transcribe-step-4a
create-audio-transcript-transcribe-step-4a

( 확대하려면 클릭 )


b.  S3 버킷을 스크롤하면서 앞서 이 자습서에서 미리 생성된 버킷을 찾습니다. 이 버킷 이름을 클릭하면 버킷 콘텐츠가 표시됩니다. 버킷 이름은 오른쪽 스크린샷과 다릅니다.

create-audio-transcript-transcribe-step-4b
create-audio-transcript-transcribe-step-4b

( 확대하려면 클릭 )


c.  버킷 내에 포함된 transcribe-sample.mp3 파일을 선택하고 [작업] 메뉴에서 [삭제]를 선택합니다. 삭제를 확인합니다.

create-audio-transcript-transcribe-step-4c
create-audio-transcript-transcribe-step-4c

( 확대하려면 클릭 )


축하합니다!

이 자습서에서 보셨듯이 Amazon Transcribe를 사용하여 음성을 텍스트로 변환하는 작업을 대량으로 처리할 수 있습니다. 고객 서비스 통화, 비즈니스 미팅, TV 방송, 온디맨드 동영상과 같은 다양한 오디오 또는 비디오 파일에 Amazon Transcribe를 사용할 수 있습니다.

 

대규모로 텍스트를 번역하는 방법

10분 자습서에서 Amazon Translate를 사용하여 트랜스크립션된 텍스트를 다른 언어로 번역하는 방법을 찾아보십시오.

Transcribe API 및 CLI 시작하기

설명서의 자습서에서 Amazon Transcribe API와 CLI를 사용하는 방법을 알아보십시오.

Amazon Comprehend 둘러보기

10분 자습서에서 Amazon Comprehend를 사용하여 텍스트에서 감정을 분석하는 방법을 알아보십시오.