게시된 날짜: Mar 11, 2021
Amazon Transcribe는 개발자가 음성 데이터를 텍스트로 변환하는 기능을 음성 지원 애플리케이션에 쉽게 추가할 수 있도록 하는 ASR(자동 음성 인식) 서비스입니다. 지금까지는 Amazon Transcribe에서 배치(비동기) API를 위한 트랜스크립션 출력에 각 단어의 신뢰도 점수만 제공했습니다. 오늘부터 Amazon Transcribe는 스트리밍(동기) 트랜스크립션 API를 위한 단어 수준 신뢰도 점수도 제공합니다.
신뢰도 점수는 서비스가 단어의 트랜스크립션을 얼마나 잘 생성하는지에 대한 자가 평가 기능으로서 정확도 측정과 혼돈하지 않아야 합니다. 각 단어는 0과 1 사이의 신뢰도 점수를 가집니다. 이 점수는 개발자가 텍스트 트랜스크립션에 사후 프로세싱 논리를 적용할 수 있는 다양한 기회를 제공합니다. 예를 들어, 키워드 검색, 번역 또는 수작업 검토와 같은 사후 프로세싱을 수행할 때 지정된 신뢰도 임계값을 충족하는 용어만 사용할 수 있습니다. 다양한 음성 애플리케이션에서 신뢰도 점수는 특정 스트리밍 오디오 사용 사례를 위해 트랜스크립트를 보완 또는 소비할 수 있는 추가적인 도구를 제공합니다. 스트리밍 트랜스크립션의 일반적인 사용 사례에는 실시간 통화 트랜스크립션 및 브로드캐스트 미디어를 위한 라이브 캡션이 포함됩니다.