Amazon Transcribe는 100개 이상의 언어를 지원하는 음성 파운데이션 모델 기반 자동 음성 인식(ASR) 서비스입니다. Transcribe의 기능을 사용하면 오디오 입력을 수집하고 읽고 검토하기 쉬운 스크립트를 작성하며 사용자 지정을 통해 정확도를 높이고 콘텐츠를 필터링하여 고객 프라이버시를 보호할 수 있습니다.

오디오 입력

Transcribe는 라이브 및 녹음된 오디오 또는 비디오 입력을 처리하여 검색 및 분석을 위한 고품질 트랜스크립션을 제공하도록 설계되었습니다. 또한 고객 통화(Amazon Transcribe Call Analytics)와 의료 대화(Amazon Transcribe Medical)를 고유하게 이해하는 별도의 API도 제공합니다.

스트리밍 및 배치 트랜스크립션

기존 오디오 녹음을 처리하거나 실시간 트랜스크립션을 위해 오디오를 스트리밍할 수 있습니다. 보안 연결을 사용하여 서비스로 라이브 오디오 스트림을 보내고 응답으로 텍스트 스트림을 수신할 수 있습니다.

오디오 입력

도메인별 모델

전화 통화 또는 멀티미디어 비디오 콘텐츠에 맞게 조정된 모델을 선택할 수 있습니다. 예를 들어 Transcribe는 고객 센터에서 흔히 볼 수 있는 저음질 전화 오디오에 따라 적절하게 조정됩니다.

자동 언어 식별

Amazon Transcribe를 사용하면 오디오 파일에서 주요 언어를 자동으로 식별하고 트랜스크립션을 생성할 수 있습니다. 미디어 라이브러리에 다른 언어의 오디오 파일이 포함되어 있을 때 유용합니다. 또한 이 기능을 사용하여 미디어 콘텐츠를 분류하고 비디오 및 팟캐스트의 주요 음성 언어에 레이블이 올바르게 지정되었는지 확인할 수 있습니다.

읽기 쉬운 트랜스크립트

Amazon Transcribe를 사용하면 읽기, 검토 및 특정 애플리케이션에 통합하기 쉬운 정확한 트랜스크립트를 생성할 수 있습니다. 통화 내용 분석, 자막 처리, 콘텐츠 검색과 같은 다운스트림 작업에 사용할 수 있도록 결과물을 준비하기 위해 노력하고 있습니다.

구두점 및 숫자 정규화

Amazon Transcribe는 구두점 및 숫자 서식을 자동으로 추가하므로 짧은 시간과 적은 비용으로 수동 트랜스크립션 품질과 거의 일치하는 결과를 제공합니다. 또한 숫자는 단어 대신 숫자 또는 “일반 형식”으로 변환됩니다.

읽기 쉬운 트랜스크립트

타임스탬프 생성

Amazon Transcribe는 각 단어에 대한 타임스탬프를 반환하므로, 원래 녹음 자료에서 단어나 구의 위치를 쉽게 찾고 동영상에 자막을 추가할 수 있습니다.

여러 명의 말하는 사람을 인식

전화 통화, 회의 및 텔레비전 쇼와 같은 시나리오를 정확하게 캡처하기 위해 텍스트에서 말하는 사람이 변경되는 것을 자동으로 인식하여 해당 사항을 기록합니다. 말하는 사람 식별에 대해 자세히 알아보세요.

채널 식별

콜 센터에서 단일 오디오 파일을 Amazon Transcribe에 제출할 수 있으며, 이 서비스는 자동으로 채널 레이블로 주석이 달린 단일 트랜스크립트가 생성되는 것을 식별합니다.

출력 사용자 지정

정확성은 매우 중요하며 특정 비즈니스 요구 사항 및 모국어에 맞게 트랜스크립트를 사용자 지정할 수 있는 다양한 옵션을 제공합니다. 또한 Transcribe는 각 문장에 대해 최대 10개의 대체 트랜스크립션을 제공하므로 콘텐츠 및 도메인에 가장 적합한 옵션을 신속하게 선택할 수 있습니다. 이는 인간 참여 루프 자막 제작 워크플로에 유용합니다.

사용자 지정 어휘

사용자 지정 어휘를 사용하여, 새로운 단어를 기본 어휘에 추가함으로써 제품 이름, 기술 용어 또는 사람 이름과 같은 도메인별 단어나 구에 대해 정확도가 높은 트랜스크립션을 생성할 수 있습니다.

출력 사용자 지정

사용자 지정 언어 모델

필요한 경우 Amazon Transcribe에 텍스트 데이터 코퍼스를 제출하여 사용 사례 및 도메인에 맞는 사용자 지정 언어 모델(CLM)을 구축하고 교육할 수 있습니다. CLM은 자체 데이터로 음성 인식 정확도를 향상시키는 데 적합한 기능입니다.

사용자 안전 및 개인정보 보호 기능

고객 개인정보 보호 및 안전은 매우 중요합니다. 필요한 경우 Transcribe를 사용하여 대상에게 민감하거나 부적절한 단어를 트랜스크립션 결과에서 마스킹하거나 제거할 수 있습니다.

어휘 필터링

어휘 필터링을 사용하여 트랜스크립트에서 제거할 단어 목록을 지정할 수 있습니다. 예를 들어 모욕적이거나 불쾌감을 주는 단어 목록을 지정하고 Amazon Transcribe를 통해 트랜스크립트에서 해당 단어를 자동으로 제거할 수 있습니다.

사용자 안전 및 개인정보 보호 기능

자동 콘텐츠 편집 / PII 편집

지시를 받으면 Amazon Transcribe는 지원되는 언어 트랜스크립트에서 민감한 개인 식별 정보(PII)를 식별하고 편집하도록 고객을 도울 수 있습니다. 따라서 콜 센터에서 트랜스크립트를 쉽게 검토하고 공유하여 고객 경험에 대한 통찰력을 확보하고 상담원을 교육할 수 있습니다.

데이터 보호

Amazon S3 키(SSE-S3)를 사용하여 저장된 데이터를 보호하거나 자체 AWS Key Management Service 키를 지정합니다. Amazon Transcribe는 HTTP를 통해 인터넷을 통한 인증된 연결 및 보안 데이터 전송을 지원하는 암호화 프로토콜인 TLS(전송 계층 보안) 1.2를 사용하고, 전송 중인 데이터를 암호화하는 AWS 인증서와 함께 사용합니다. 여기에는 스트리밍 트랜스크립션이 포함됩니다. 

유해한 오디오 콘텐츠 감지

Amazon Transcribe Toxicity Detection은 기계 학습을 사용하여 음성 대화를 정중하고 건설적인 방식으로 진행함으로써 안전하고 포용적인 온라인 환경을 장려합니다. 유해한 오디오 콘텐츠는 관리자가 쉽게 식별하고 적절한 조치를 취할 수 있도록 여러 범주 중 하나로 분류됩니다. 

Amazon Transcribe Call Analytics

Amazon Transcribe Call Analytics를 통해 통화 감성, 음량 등의 대화 통찰력을 추출하여 상담원 생산성과 고객 경험을 개선합니다.

생성형 AI 기반 통화 요약으로 고객 센터의 생산성 개선

통화 요약을 자동으로 생성하여 에이전트가 우수한 고객 경험을 제공하는 데 집중할 수 있도록 돕고 통화 후 수동 요약을 줄여 생산성을 높일 수 있습니다. 이 기능은 발신자와의 상호 작용을 요약하여 전화한 이유, 문제 해결 단계, 다음 단계와 같은 주요 구성 요소를 포착합니다. 고객 센터 관리자는 발신자의 문제를 조사하는 동안 전체 대화 내용을 읽지 않고도 통화 요약을 검토하여 상호 작용의 컨텍스트를 빠르게 이해할 수 있습니다.

자세한 통화 분석 및 대화 인사이트 추출

기계 학습의 힘을 사용하면 음성-텍스트 변환 및 자연어 처리 기능을 빠르게 적용하여 귀중한 대화 인사이트를 발견할 수 있습니다. 그런 다음 고객과 에이전트의 감정, 감지된 문제, 침묵 시간, 대화 중단 시간, 말하기 속도를 비롯한 대화 성격 등의 인사이트를 인바운드 및 아웃바운드 통화 분석 애플리케이션에 통합할 수 있습니다. 따라서 감독자가 잠재적인 고객 문제, 에이전트 코칭 기회, 통화 추세를 보다 손쉽게 파악할 수 있습니다.

Amazon Transcribe Call Analytics

자동화된 통화 분류로 규정 준수 및 모니터링 개선

대규모로 통화를 모니터링하여 회사 정책 또는 규제 요건을 준수하는지 여부를 추적합니다. 지정된 기준(예: 단어/구절 또는 대화 성격)에 따라 자체적인 맞춤형 범주를 구축하고 훈련합니다. 예를 들어 업셀 또는 어카운트 취소 통화의 비율을 확인하기 위해 범주 레이블을 설정할 수 있습니다.

풍부한 통화 스크립트 생성

상담원들에게 과거 상호작용의 대화 세부 정보에 대한 액세스 권한을 부여할 수 있습니다. 턴바이턴 트랜스크립트는 고객 감정, 감지된 문제 및 중단과 같은 인사이트를 제공합니다.

민감한 고객 데이터 보호

가끔 이름, 주소, 신용카드 번호, 주민등록번호 같은 고객의 민감한 데이터가 포함된 대화도 있습니다. Transcribe Call Analytics는 오디오와 텍스트 양쪽에서 이런 정보를 식별하고 수정하도록 고객을 도와줍니다.

고객 센터 통합

Genesys Cloud CX
Genesys Cloud CX는 전화, 문자, 채팅 등 다양한 채널에서 고객과 인사이트 경험을 통합하는 클라우드 고객 센터 솔루션입니다. Genesys Cloud드 환경에서 통화 오디오를 Amazon Transcribe로 스트리밍하여 에이전트 생산성을 개선하고 고객 상호 작용 인사이트를 얻을 수 있습니다. 자세한 내용은 Genesys Cloud AudioHook 통합을 참조하세요. 또한 AWS Live Call Analytics 솔루션으로 Genesys Cloud 통화 분석을 시작할 수 있습니다.

Amazon Chime SDK
Amazon Chime SDK는 개발자가 웹, 모바일 또는 전화 통신 애플리케이션에 음성 통화, 화상 통화 및 화면 공유 기능을 간단히 추가할 수 있는 실시간 커뮤니케이션 구성 요소 세트입니다. 

Amazon Chime Voice Connector
Amazon Chime Voice Connector를 사용하면 SIP 기반 콜 센터와 쉽게 통합하여 Amazon Transcribe를 통해 사용자 기여도가 있는 실시간 트랜스크립트를 생성할 수 있습니다. 자세한 내용은 Amazon Chime Voice Connector 설명서를 참조하세요.

Amazon Transcribe Medical

의료 전문 분야

HIPAA 적격 자동 음성 인식(ASR) 서비스인 Transcribe Medical을 사용하여 의료 대화 내용을 쉽게 녹음할 수 있습니다.

받아쓰기 모드

의료 받아쓰기 사용 사례에서 흔히 볼 수 있는 단일 화자 오디오를 정확하게 녹음할 수 있습니다. 자세히 알아보기 »

대화형 모드

임상의 및/또는 환자로 구성된 다중 화자 대화 오디오를 정확하게 녹음할 수 있습니다. 자세히 알아보기 »

Amazon Transcribe Medical

다양한 의료 전문 분야에서 음성을 텍스트로 변환할 수 있습니다. 자세히 알아보기 »

배치 API

녹음된 의료 오디오 파일을 높은 동시성으로 대규모로 트랜스크립션할 수 있습니다. 자세히 알아보기 »

스트리밍 API

WebSocket 보안 또는 HTTP/2 프로토콜을 통해 거의 실시간으로 오디오 스트림을 트랜스크립션할 수 있습니다. 자세히 알아보기 »

사용자 지정 어휘

어휘 목록을 벗어날 수 있는 용어에 대해 사용자 지정 어휘를 사용하여 트랜스크립션 정확도를 높이세요. 자세히 알아보기 »

채널 식별

추가 비용 없이 다중 채널 오디오를 동시에 녹음할 수 있습니다. 일관성 있는 최종 트랜스크립트를 받아보세요. 자세히 알아보기 »

화자 구분

모든 모노 채널 오디오 내에서 음성을 다른 화자와 분리할 수 있습니다. 자세히 알아보기 »

제품 요금에 대해 자세히 알아보기

Amazon Transcribe 요금금 페이지를 방문하세요.

자세히 알아보기 
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

가입 
콘솔에서 구축 시작

AWS Management Console에서 Amazon Transcribe로 구축을 시작하세요.

로그인