Amazon Transcribe

음성을 텍스트로 자동 변환

Amazon Transcribe는 개발자가 음성을 텍스트로 변환하는 기능을 애플리케이션에 쉽게 추가할 수 있도록 합니다. 사실상 컴퓨터가 오디오 데이터를 검색하고 분석하기는 불가능합니다. 그래서 기록된 음성을 텍스트로 변환한 다음에 애플리케이션에서 사용할 수 있습니다. 예전에는 고객이 녹취 제공업체와 협력해야 했는데, 값비싼 계약을 해야 하는 데다 이런 작업을 수행할 때 자신의 기술 스택을 통합하기 어려웠습니다. 이런 제공업체 대부분은 시나리오가 바뀌면 적응하지 못하는 오래된 기술을 사용합니다. 예를 들어 콜 센터에서는 전화 오디오의 충실도가 낮은 경우가 많은데, 그러면 정확도가 형편없이 떨어집니다.

Amazon Transcribe는 자동 음성 인식(ASR)이라는 딥 러닝 프로세스를 사용하여 음성을 텍스트로 빠르고 정확하게 변환합니다. Amazon Transcribe를 사용하면 고객 서비스 호출을 기록하고, 폐쇄 자막 삽입 및 자막 처리를 자동화하고, 미디어 자산에 대한 메타데이터를 생성하여 완전히 검색 가능한 아카이브를 만들 수 있습니다. Amazon Transcribe Medical을 사용하여 음성 진료 내용을 텍스트로 변환하는 기능을 임상 문서 애플리케이션에 추가할 수 있습니다.

주요 기능

읽기 쉬운 트랜스크립션

Amazon Transcribe는 구두점 및 서식을 자동으로 추가하므로 짧은 시간과 적은 비용으로 수동 트랜스크립션 품질과 거의 일치하는 결과를 제공합니다.

트랜스크립션 스트리밍

일괄 처리 또는 거의 실시간으로 오디오를 처리할 수 있습니다. 보안 연결을 사용하여 서비스로 라이브 오디오 스트림을 보내고 응답으로 텍스트 스트림을 수신할 수 있습니다.

타임스탬프 생성

Amazon Transcribe는 각 단어에 대한 타임스탬프를 반환하므로, 원래 녹음 자료에서 단어나 구의 위치를 쉽게 찾고 동영상에 자막을 추가할 수 있습니다.

사용자 지정 어휘

새로운 단어를 기본 어휘에 추가하여 제품 이름, 기술 용어 또는 사람 이름과 같은 도메인별 단어나 구에 대해 정확도가 높은 트랜스크립션을 생성할 수 있습니다.

여러 명의 말하는 사람을 인식

전화 통화, 회의 및 텔레비전 쇼와 같은 시나리오를 정확하게 캡처하기 위해 텍스트에서 말하는 사람이 변경되는 것을 자동으로 인식하여 해당 사항을 기록합니다.

채널 식별

콜센터에서 단일 오디오 파일을 Amazon Transcribe에 제출할 수 있으며, 이 서비스는 자동으로 채널 레이블로 주석이 달린 단일 트랜스크립트가 생성되는 것을 식별합니다.

사용 사례

고객 서비스 개선

오디오 입력을 텍스트로 변환하는 Amazon Transcribe를 사용하면 음성 입력을 검색하고 분석할 수 있는 텍스트 분석 애플리케이션을 구축할 수 있습니다. 고객 문의 센터에서는 Amazon Transcribe를 사용하여 호출을 기록하고, 통찰력을 얻기 위해 Amazon Comprehend와 같은 다른 AWS 서비스를 사용하여 데이터를 마이닝하여 의미와 의도를 추출할 수 있습니다.

자막 삽입 및 처리 워크플로

Amazon Transcribe는 비디오 콘텐츠와 함께 표시될 수 있고 타임스탬프가 찍힌 자막을 자동으로 생성함으로써 콘텐츠 생산자 및 미디어 배급자가 접근성과 액세스 기능을 개선하는 데 도움을 줄 수 있습니다. 이 텍스트를 Amazon Translate와 결합하면 동영상을 쉽게 현지화할 수 있습니다.

오디오 아카이브 분류

Amazon Transcribe를 사용하여 규정 준수 모니터링 및 리스크 관리를 위해 오디오와 동영상 자산을 완벽하게 검색 가능한 아카이브에 기록할 수 있습니다. 오디오를 텍스트로 변환하고 Amazon Elasticsearch를 사용하여 오디오/동영상 라이브러리 전체에서 인덱싱하고 검색합니다.

Amazon Transcribe 고객

Amazon Transcribe 요금에 대해 자세히 알아보기

요금 페이지로 이동하기
구축할 준비가 되셨습니까?
추가 질문이 있으십니까?
AWS에 문의