이 AWS 솔루션 구현은 어떤 기능을 제공하나요?
이 솔루션은 라이브 스트리밍 동영상 콘텐츠에 대한 다국어 자막을 자동 생성합니다.
트랜스크립션 및 번역에 대한 기계 학습 서비스를 사용하여 이 솔루션에서는 속기사 없이도 자막 프로세스를 자동화할 수 있으며, 단일 입력 언어에 대해 최대 5개의 번역된 캡션 언어를 지원합니다. 자막은 속기사처럼 오디오와 약간의 시간 지연이 존재합니다. 이 솔루션에는 방송용 애플리케이션을 위해 사람의 감독이나 추가 사용자 지정이 필요할 수도 있습니다.
AWS 솔루션 구현 개요
AWS에서는 라이브 스트리밍 비디오를 위한 다국어 자막을 자동으로 생성하는 서버리스 아키텍처를 구축할 수 있도록 Amazon Transcribe, Amazon Translate 및 AWS Lambda를 결합하여 라이브 스트리밍 비디오 콘텐츠를 위한 실시간 자막 솔루션을 제공합니다. 아래 다이어그램은 솔루션의 구현 안내서와 함께 AWS CloudFormation 템플릿을 사용하여 자동으로 배포할 수 있는 아키텍처를 보여줍니다.

Live Streaming with Automated Multi-Language Subtitling 아키텍처
솔루션의 AWS CloudFormation 템플릿에서는 다음과 같은 추가 서비스와 함께 Live Streaming on AWS를 배포합니다.
- AWS Elemental MediaLive
- AWS Elemental MediaPackage
- Amazon CloudFront
- Amazon CloudWatch Events
- Amazon Simple Notification Service(Amazon SNS)
- Amazon Simple Storage Service(Amazon S3)
- Amazon Transcribe
- Amazon Elastic Container Service(Amazon ECS)
- Amazon Translate
- AWS Lambda
AWS Elemental MediaPackage에 WebVTT 자막을 가져오기 위해 Amazon CloudFront에서 Lambda@Edge 함수를 사용하여 HLS 스트림에 자막을 삽입합니다. 이 자막은 AWS Elemental MediaLive에서 AWS Elemental MediaPackage로 전송됩니다. Amazon MediaLive는 HLS를 Amazon CloudFront 엔드포인트에 출력합니다. 이 엔드포인트는 비디오 파일을 통해 전달되고 구현되며, AWS Elemental MediaLive에서 AWS Elemental MediaPackage로 전달되는 WebVTT 자막 파일에 대해서만 Lambda@Edge 함수를 호출합니다. Amazon MediaPackage에 전달하기 전에 이러한 WebVTT 파일에 자막이 삽입됩니다.
AWS Elemental MediaLive는 오디오 전용 User Datagram Protocol(UDP) 스트림을 Amazon ECS 컨테이너에 출력합니다. 이 컨테이너는 오디오를 Amazon Transcribe 스트리밍에 전송합니다. 그러면 이 스트리밍에서는 비동기 응답으로 스트림에 포함된 텍스트를 수신하고 Amazon Dynamo DB 테이블에 각 텍스트 응답을 씁니다. 또한, 이 Amazon ECS 컨테이너는 Amazon SNS 알림을 Amazon Translate Lambda 함수에 전송합니다. 그러면 함수에서는 동일한 Amazon Dynamo DB 테이블에 쓴 번역된 자막을 생성합니다.
각 WebVTT 파일은 Lambda@Edge 함수를 호출합니다. 이때 이 함수는 자막을 삽입하고 MediaPackage에 자막을 전송합니다. MediaLive는 인증 헤더를 제공합니다.
Live Streaming with Automated Multi-Language Subtitling
버전 2.0.0
최종 업데이트 날짜: 2020년 12월
작성: AWS
예상 배포 시간: 20분
참고: RSS 업데이트에 가입하려면 사용 중인 브라우저에 대해 RSS 플러그인이 활성화되어 있어야 합니다.