Amazon Transcribe 기능

Amazon Transcribe를 사용해야 하는 이유

Amazon Transcribe는 음성을 텍스트로 변환하는 기능을 어떤 애플리케이션에든 쉽게 추가할 수 있는 자동 음성 인식 서비스입니다. Transcribe의 기능을 사용하면 오디오 입력을 수집하고 읽고 검토하기 쉬운 스크립트를 작성하며 사용자 지정을 통해 정확도를 높이고 콘텐츠를 필터링하여 고객 프라이버시를 보호할 수 있습니다.

오디오 입력

Transcribe는 라이브 및 녹음된 오디오 또는 비디오 입력을 처리하여 검색 및 분석을 위한 고품질 트랜스크립션을 제공하도록 설계되었습니다. 또한 고객 통화(Amazon Transcribe Call Analytics)와 의료 대화(Amazon Transcribe Medical)를 고유하게 이해하는 별도의 API도 제공합니다.

오디오 입력

읽기 쉬운 트랜스크립트

Amazon Transcribe를 사용하면 읽기, 검토 및 특정 애플리케이션에 통합하기 쉬운 정확한 트랜스크립트를 생성할 수 있습니다. 통화 내용 분석, 자막 처리, 콘텐츠 검색과 같은 다운스트림 작업에 사용할 수 있도록 결과물을 준비하기 위해 노력하고 있습니다.

읽기 쉬운 트랜스크립트

출력 사용자 지정

정확성은 매우 중요하며 특정 비즈니스 요구 사항 및 모국어에 맞게 트랜스크립트를 사용자 지정할 수 있는 다양한 옵션을 제공합니다. 또한 Transcribe는 각 문장에 대해 최대 10개의 대체 트랜스크립션을 제공하므로 콘텐츠 및 도메인에 가장 적합한 옵션을 신속하게 선택할 수 있습니다. 이는 인간 참여 루프 자막 제작 워크플로에 유용합니다.

출력 사용자 지정

사용자 안전 및 개인정보 보호 기능

고객 개인정보 보호 및 안전은 매우 중요합니다. 필요한 경우 Transcribe를 사용하여 대상에게 민감하거나 부적절한 단어를 트랜스크립션 결과에서 마스킹하거나 제거할 수 있습니다.

사용자 안전 및 개인정보 보호 기능

생성형 통화 요약으로 콜 센터 생산성 개선

생성형 AI 기반 통화 요약을 자동으로 생성하여 에이전트가 우수한 고객 경험을 제공하는 데 집중할 수 있도록 돕고 통화 후 작업을 제거하여 생산성을 높일 수 있습니다. 관리자는 이 같은 요약을 빠르게 검토함으로써 전체 트랜스크립트를 검토하지 않고도 대화의 맥락을 파악하고 고객 문제를 조사할 수 있습니다.

Amazon Transcribe Call Analytics

오디오 입력

기존 오디오 녹음을 처리하거나 실시간 트랜스크립션을 위해 오디오를 스트리밍할 수 있습니다. 보안 연결을 사용하여 서비스로 라이브 오디오 스트림을 보내고 응답으로 텍스트 스트림을 수신할 수 있습니다.

전화 통화 또는 멀티미디어 비디오 콘텐츠에 맞게 조정된 모델을 선택할 수 있습니다. 예를 들어 Transcribe는 고객 센터에서 흔히 볼 수 있는 저음질 전화 오디오에 따라 적절하게 조정됩니다.

Amazon Transcribe를 사용하면 언어 코드를 지정하지 않고도 오디오 파일이나 스트리밍 미디어에서 사용되는 언어를 자동으로 식별할 수 있습니다. Amazon Transcribe는 주로 사용되는 언어를 식별하거나 오디오에 여러 언어가 포함된 경우 사용된 모든 언어를 식별하고 그에 따라 음성을 텍스트로 변환할 수 있습니다. 이 기능은 고객이 언어를 전환하거나 미디어 라이브러리에 다른 언어로 된 오디오 파일이 포함되어 있을 때 유용합니다. 또한 이 기능을 사용하여 미디어 콘텐츠를 분류하고 비디오 및 팟캐스트의 주요 음성 언어에 레이블이 올바르게 지정되었는지 확인할 수 있습니다.

읽기 쉬운 트랜스크립트

Amazon Transcribe는 구두점 및 숫자 서식을 자동으로 추가하므로 짧은 시간과 적은 비용으로 수동 트랜스크립션 품질과 거의 일치하는 결과를 제공합니다. 또한 숫자는 단어 대신 숫자 또는 “일반 형식”으로 변환됩니다.

Amazon Transcribe는 각 단어에 대한 타임스탬프를 반환하므로, 원래 녹음 자료에서 단어나 구의 위치를 쉽게 찾고 동영상에 자막을 추가할 수 있습니다.

전화 통화, 회의 및 텔레비전 쇼와 같은 시나리오를 정확하게 캡처하기 위해 텍스트에서 말하는 사람이 변경되는 것을 자동으로 인식하여 해당 사항을 기록합니다. 말하는 사람 식별에 대해 자세히 알아보세요.

콜 센터에서 단일 오디오 파일을 Amazon Transcribe에 제출할 수 있으며, 이 서비스는 자동으로 채널 레이블로 주석이 달린 단일 트랜스크립트가 생성되는 것을 식별합니다.

사용자 지정

사용자 지정 어휘를 사용하면 새로운 단어를 기본 어휘에 추가하여 제품 이름, 기술 용어 또는 사람 이름과 같은 도메인별 단어나 구에 대해 정확도가 높은 트랜스크립션을 생성할 수 있습니다.

필요한 경우 Amazon Transcribe에 텍스트 데이터 코퍼스를 제출하여 사용 사례 및 도메인에 맞는 사용자 지정 언어 모델(CLM)을 구축하고 훈련할 수 있습니다. CLM은 자체 데이터로 음성 인식 정확도를 향상시키는 데 적합한 기능입니다.

프라이버시 및 보안

어휘 필터링을 사용하여 트랜스크립트에서 제거할 단어 목록을 지정할 수 있습니다. 예를 들어 모욕적이거나 불쾌감을 주는 단어 목록을 지정하고 Amazon Transcribe를 통해 트랜스크립트에서 해당 단어를 자동으로 제거할 수 있습니다.

Amazon S3 키(SSE-S3)를 사용하여 저장 데이터를 보호하거나 자체 AWS Key Management Service 키를 지정합니다. Amazon Transcribe는 HTTP를 통해 인터넷을 통한 인증된 연결 및 보안 데이터 전송을 지원하는 암호화 프로토콜인 TLS(전송 계층 보안) 1.2를 사용하고, 전송 중 데이터를 암호화하는 AWS 인증서와 함께 사용합니다. 여기에는 스트리밍 트랜스크립션이 포함됩니다. 

Amazon Transcribe는 지시를 받으면 지원되는 언어 트랜스크립트에서 민감한 개인 식별 정보(PII)를 식별하고 편집하도록 고객을 도울 수 있습니다. 따라서 콜 센터에서 트랜스크립트를 쉽게 검토하고 공유하여 고객 경험에 대한 통찰력을 확보하고 상담원을 교육할 수 있습니다.

Amazon Transcribe Toxicity Detection은 기계 학습을 사용하여 음성 대화를 정중하고 건설적인 방식으로 진행함으로써 안전하고 포용적인 온라인 환경을 장려합니다. 유해한 오디오 콘텐츠는 관리자가 쉽게 식별하고 적절한 조치를 취할 수 있도록 여러 범주 중 하나로 분류됩니다. 

Transcribe Call Analytics

통화 요약을 생성하여 에이전트가 고객과의 대화에서 중요한 부분(예: 문제, 결과 또는 조치 사항)을 자동으로 포착함으로써 우수한 고객 경험을 제공하는 데 집중하고 통화 후 생산성을 높이는 데 도움을 줍니다. 관리자는 이 같은 요약을 빠르게 검토함으로써 전체 트랜스크립트를 검토하지 않고도 대화의 맥락을 파악하고 고객 문제를 조사할 수 있습니다.

기계 학습의 힘을 사용하면 음성-텍스트 변환 및 자연어 처리 기능을 빠르게 적용하여 귀중한 대화 인사이트를 발견할 수 있습니다. 그런 다음 고객과 에이전트의 감정, 감지된 문제, 침묵 시간, 대화 중단 시간, 말하기 속도를 비롯한 대화 성격 등의 인사이트를 인바운드 및 아웃바운드 통화 분석 애플리케이션에 통합할 수 있습니다. 따라서 감독자가 잠재적인 고객 문제, 에이전트 코칭 기회, 통화 추세를 보다 손쉽게 파악할 수 있습니다.

대규모로 통화를 모니터링하여 회사 정책 또는 규제 요건을 준수하는지 여부를 추적합니다. 지정된 기준(예: 단어/구절 또는 대화 성격)에 따라 자체적인 맞춤형 범주를 구축하고 훈련합니다. 예를 들어 업셀 또는 어카운트 취소 통화의 비율을 확인하기 위해 범주 레이블을 설정할 수 있습니다.

상담원들에게 과거 상호작용의 대화 세부 정보에 대한 액세스 권한을 부여할 수 있습니다. 턴바이턴 트랜스크립트는 고객 감정, 감지된 문제 및 중단과 같은 인사이트를 제공합니다.

Transcribe Medical

의료 받아쓰기 사용 사례에서 흔히 볼 수 있는 단일 화자 오디오를 정확하게 녹음할 수 있습니다. 자세히 알아보기

임상의 및/또는 환자로 구성된 다중 화자 대화 오디오를 정확하게 녹음할 수 있습니다. 자세히 알아보기

다양한 의료 전문 분야에서 음성을 텍스트로 변환할 수 있습니다. 자세히 알아보기

녹음된 의료 오디오 파일을 높은 동시성으로 대규모로 트랜스크립션할 수 있습니다. 자세히 알아보기

어휘 목록을 벗어날 수 있는 용어에 대해 사용자 지정 어휘를 사용하여 트랜스크립션 정확도를 높이세요. 자세히 알아보기

모든 모노 채널 오디오 내에서 음성을 다른 화자와 분리할 수 있습니다. 자세히 알아보기