게시된 날짜: Jul 26, 2023

오늘 AWS는 ML을 활용한 음성 기반 유해성 검출 기능인 Amazon Transcribe 유해성 검출 기능을 발표했습니다. Amazon Transcribe 유해성 검출은 오디오 및 텍스트 기반의 신호를 모두 활용하여 유해 콘텐츠를 식별하고 분류합니다. Amazon Transcribe는 음성을 텍스트로 변환하는 기능을 애플리케이션에 쉽게 추가할 수 있게 지원하는 자동 음성 인식(ASR) 서비스입니다. Transcribe 유해성 검출 기능은 텍스트 외에도 톤 및 음높이와 같은 음성 신호를 사용하여 대화 내의 유해한 의도를 파악합니다. 유해 콘텐츠는 신고되고 성희롱, 모욕적 언어, 위협, 남용, 욕설, 모욕 및 그래픽 등 7개의 카테고리로 분류됩니다. 이를 통해 조정자는 전체 대화를 검토하는 대신 집중적인 조치를 취할 수 있습니다. 

유해성 검출 기능은 산업 전반에서 사용되며, 주로 온라인 게임과 소셜 미디어 공간에서 사용됩니다. 예를 들어, 온라인 게임은 특히 보고된 사건이 있을 경우 유해성 검출 기능을 사용하여 플레이어 간의 음성 대화를 모니터링합니다. 일반적으로 인간 조정자가 긴 녹화 자료를 검토하여 유해 콘텐츠를 찾아내고 조치를 취합니다. 이제 Amazon Transcribe 유해성 검출 기능을 통해 인간 조정자가 대화에서 유해 콘텐츠가 사용된 정확한 위치를 확인하고 사용된 언어를 유해성 점수로 분류할 수 있습니다. 이렇게 하면 대화 내용을 들으면서 소요되는 시간이 95% 줄어들어 조정자가 더 많은 오디오를 처리하고 유해성이 검출되었을 때 더 빠르게 조치를 취할 수 있습니다. 

Amazon Transcribe 유해성 검출 기능은 현재 미국 영어로 제공되며 배치 처리가 가능합니다. 이 기능은 미국 동부(버지니아 북부), 미국 동부(오하이오), 미국 서부(오레곤), 아시아 태평양(시드니), 유럽(아일랜드) 및 유럽(런던) 등의 AWS 리전에서 지원됩니다. 유해성 검출 요금에 설명된 대로 추가 비용이 발생합니다. 자세한 내용은 “Amazon Transcribe 유해성 검출 기능을 사용하여 음성 대화 내 유해 언어 신고하기” 게시물 및 Amazon Transcribe 설명서를 참조하세요.