일반

Q: Amazon Transcribe란 무엇입니까?

Amazon Transcribe는 고객이 손쉽게 음성을 텍스트로 변환할 수 있게 해주는 AWS 서비스입니다. ASR(자동 음성 인식) 기술을 사용하므로 고객은 음성 기반 고객 서비스 통화 트랜스크립션, 오디오/비디오 콘텐츠의 자막 생성, 오디오/비디오 콘텐츠에 콘텐츠 분석(텍스트 기반) 수행을 비롯해 다양한 비즈니스 애플리케이션에 Amazon Transcribe를 사용할 수 있습니다.  

Q: Amazon Transcribe는 다른 AWS 제품과 어떻게 상호작용합니까?

Amazon Transcribe는 오디오 입력을 텍스트로 변환하여 다양한 텍스트 분석 애플리케이션이 음성 입력을 사용할 수 있는 기회를 제공합니다. 예를 들어 Amazon Transcribe에서 변환한 텍스트 데이터에 Amazon Comprehend를 사용하면 감성 분석을 수행하거나 엔터티 및 핵심 문구를 추출할 수 있습니다. 이와 마찬가지로 Amazon Translate와 Amazon Polly를 통합하면 한 언어로 음성 입력을 받고 다른 언어로 번역한 후 음성 출력을 생성하여 다국어 대화를 효과적으로 지원할 수 있습니다. 또한 Amazon Transcribe를 Amazon Elasticsearch와 통합하면 오디오/비디오 라이브러리에서 텍스트 기반 검색을 인덱싱 및 수행할 수 있습니다. 

Q: Amazon Transcribe 서비스를 사용하기 전에 어떤 점을 알고 있어야 합니까?

Amazon Transcribe 서비스는 음량, 음의 고저, 말하는 속도에서의 차이를 포함하여 다양한 음성 및 청각적 특성을 처리하도록 설계되었습니다. 오디오 신호(배경 소음, 음성이 중첩된 화자, 악센트가 있는 음성 또는 단일 오디오 파일 내 여러 언어 간에 전환과 같은 요소 등 포함)의 콘텐츠 및 품질은 서비스 출력의 정확성에 영향을 줄 수 있습니다. 지속적인 서비스 업데이트를 통해 다양한 발음의 차이를 인식하고 추가 콘텐츠 유형을 지원하도록 개선하고 있습니다. 

Amazon Transcribe 사용

Q: 개발자가 Transcribe에 액세스하려면 어떻게 해야 합니까?

Amazon Transcribe를 시작하는 가장 쉬운 방법은 콘솔을 사용하여 오디오 파일을 트랜스크립션하는 작업을 제출하는 것입니다. 또한, AWS 명령줄 인터페이스에서 서비스를 직접 호출하거나 지원되는 SDK 중 원하는 것을 사용해 애플리케이션에 통합할 수 있습니다. 어떤 방법이든 Amazon Transcribe 사용을 시작하여 코드 몇 줄을 통해 오디오 파일에 대한 자동 트랜스크립션을 생성할 수 있습니다.

Q: Amazon Transcribe에서는 어떤 종류의 입력을 지원합니까?

Amazon Transcribe는 16kHz 및 8kHz 오디오 스트림과 WAV, MP3, MP4 및 FLAC를 비롯한 여러 오디오 인코딩을 지원합니다.

Q: Amazon Transcribe에서 실시간 트랜스크립션을 지원합니까?

예. Amazon Transcribe를 사용하면 사용자는 HTTP2를 통해 양방향 스트리밍을 열 수 있습니다. 사용자는 오디오 스트림을 서비스에 전송하고 텍스트 스트림을 실시간으로 반환 받을 수 있습니다.  

Q: 실시간 트랜스크립션이 지원하는 인코딩은 무엇입니까?

트랜스크립션 스트리밍은 현재 16비트 Linear PCM 인코딩을 지원합니다. 

Q: Amazon Transcribe에서는 어떤 언어를 지원합니까?

언어 지원에 대한 내용은 이 설명서 페이지를 참조하십시오. 

Q: Amazon Transcribe는 어떤 디바이스에서 작동합니까?

Amazon Transcribe는 대부분의 경우 디바이스의 구애를 받지 않습니다. 일반적으로 Amazon Transcribe는 휴대전화, PC, 태블릿, IoT 디바이스(예: 차량 오디오 시스템)와 같이 디바이스에 마이크가 장착된 모든 디바이스에서 작동합니다. Amazon Transcribe API가 디바이스에 입력되고 있는 오디오 스트림의 품질(8Khz 또는 16Khz)을 탐지하고, 음성 텍스트 변환용 음향 모델을 적절하게 선택합니다. 또한, 개발자는 애플리케이션을 통해 Transcribe API를 호출하여 음성 텍스트 변환 기능에 액세스할 수 있습니다. 

Q: Amazon Transcribe가 처리할 수 있는 오디오 콘텐츠에 크기 제한이 있습니까?

Amazon Transcribe 서비스 호출은 배치 서비스의 경우 API 호출당 4시간(또는 2GB)으로 제한됩니다. 스트리밍 서비스는 최대 4시간까지 연결된 상태를 수용할 수 있습니다. 

Q: Amazon Transcribe에서는 어떤 프로그래밍 언어를 지원합니까?

Amazon Transcribe 배치 서비스에서는 .NET, Go, Java, Javascript, PHP, Python 및 Ruby를 지원합니다.
Amazon Transcribe 실시간 서비스에서는 Java SDK, Ruby SDK 및 C++ SDK를 지원합니다. 다른 SDK에 대한 지원도 곧 제공될 예정입니다. 자세한 내용은 리소스 페이지를 참조하십시오. 

Q: 내 사용자 지정 어휘 단어가 인식되지 않습니다! 어떻게 해야 합니까?

음성 인식 출력은 사용자 지정 어휘 항목 외에도 다양한 요소의 영향을 받으므로 사용자 지정 어휘에 포함된 용어라고 해서 올바르게 인식될 것이라는 보장은 없습니다.
그러나, 가장 많이 발생하는 원인은 사용자 지정 단어에 올바른 발음이 누락된 경우입니다. 사용자 지정 단어에 대한 발음을 제공하지 않은 경우 새 발음을 생성해 보십시오. 이미 발음을 제공한 경우에는 올바른지 재확인하거나, 필요한 경우 다른 형태의 발음을 포함합니다. 이렇게 하려면 사용자 지정 어휘 파일에 발음 필드가 서로 다른 여러 항목을 생성하면 됩니다.

Q: 내 출력에 너무 많은 사용자 지정 단어가 보이는 이유는 무엇입니까?

사용자 지정 어휘는 표적화된 단어로 구성된 짧은 목록에 맞게 최적화되어 있습니다. 어휘가 많으면 사용자 지정 단어가 과다하게 생성될 수 있습니다. 이는 특히 비슷하게 발음되는 단어들이 포함되어 있을 때 두드러집니다. 목록이 긴 경우에는 드문 단어와 오디오 파일에서 실제로 기대되는 단어를 주로 포함하도록 목록을 줄여 보십시오. 여러 사용 사례를 커버하도록 많은 어휘를 포함하는 경우 서로 다른 사용 사례별로 목록을 분리하십시오. 길이가 짧고 다른 여러 단어와 비슷한 소리가 나는 단어는 과다한 생성으로 이어질 수 있습니다(출력에 너무 많은 사용자 지정 단어가 등장함). 이러한 단어는 주변 단어와 결합하여 하이픈으로 구분된 구 형태로 나열하는 것이 좋습니다. 예를 들어, “A.D.”라는 사용자 지정 단어는 ‘A.D.-converter’와 같은 구의 일부에 포함될 수 있습니다.

Q: 사용자 지정 어휘 테이블에는 발음을 제공하는 방식이 IPA 또는 SoundsLike 필드의 두 가지가 있습니다. 어느 것이 더 좋습니까?

IPA는 보다 정확한 발음을 지원합니다. IPA를 생성할 수 있는 경우에는 IPA 발음을 제공해야 합니다(예: IPA 발음이 있는 어휘 목록 또는 온라인 변환 도구를 통해).

Q: IPA를 사용하고 싶지만 언어학 전문가가 아닙니다. 내가 사용할 수 있는 온라인 도구가 있습니까?

Oxford English Dictionary 또는 Cambridge Dictionary와 같은 몇 가지 표준 사전(온라인 버전 포함)에서 IPA 발음을 제공합니다. 온라인 변환기(예: 영어의 경우 easypronunciation.com 또는 tophonetics.com)도 있지만 대부분의 경우 이러한 도구는 해당 사전에 기반하고 있으며 고유 명사와 같은 일부 단어에 대해서는 올바른 IPA를 생성하지 못할 수 있습니다. Amazon Transcribe는 어떤 타사 도구도 후원하지 않습니다.

Q: 동일한 언어의 서로 다른 억양에 특정된 별도의 IPA 표준이 필요합니까(예: 미국 영어 대 영국 영어)?

처리하려는 오디오 파일에 적합한 IPA 표준을 사용해야 합니다. 예를 들어, 영국 영어 화자의 오디오를 처리해야 하는 경우 영국 영어 발음 표준을 사용합니다. 허용되는 IPA 기호의 집합은 Amazon Transcribe가 지원하는 언어와 억양에 따라 다를 수 있습니다. 발음이 허용된는 문자만 포함하는지 확인하십시오. IPA 문자 집합에 대한 세부 정보는 설명서(https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html#charsets)에서 찾을 수 있습니다.

Q: 사용자 지정 어휘 테이블의 SoundslLike 필드를 사용하여 발음을 제공하려면 어떻게 해야 합니까?

단어나 구를 더 작은 조각으로 나누고 각 조각에 해당 언어의 표준 표기법을 사용하여 단어의 음을 모방하는 발음을 제공할 수 있습니다. 예를 들어, 영어에서 Los-Angeles라는 구에 대한 발음 힌트를 loss-ann-gel-es와 같이 제공할 수 있습니다. Etienne이라는 단어에 대한 힌트는 eh-tee-en과 같은 모양이 될 수 있습니다. 각 힌트 부분은 하이픈(-)으로 분리하며, 입력 언어에 허용되는 모든 문자를 사용할 수 있습니다.

Q: 두문자어를 제공하는 두 가지 방식(마침표 포함 및 마침표 없이 발음 포함)은 어떻게 작동합니까?

마침표를 포함하는 두문자어를 사용하는 경우 철자 발음은 내부적으로 생성됩니다. 마침표를 사용하지 않는 경우, 발음 필드에 발음을 제공하십시오. 일부 두문자어의 경우, 철자 발음이 있는지 단어 형식의 발음(예: NATO는 종종 ‘ɛn eɪ ti oʊ’(N. A. T. O.) 대신 ‘n eɪ t oʊ’(nay-toh)이 있는지 명백하지 않을 수 있습니다.

Q: 사용자 지정 발음을 사용하는 방법에 대한 예는 어디에서 찾을 수 있습니까?

샘플 입력 형식과 예제는 설명서(https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html)에서 찾을 수 있습니다.

Q: 잘못된 IPA를 사용하면 어떻게 됩니까? 확실하지 않은 경우, IPA를 아예 입력하지 않는 것이 더 낫습니까?

시스템은 사용자가 제공한 발음을 사용합니다. 제공된 발음이 올바르며 음성과 일치하는 경우 단어가 올바르게 인식될 가능성이 높아집니다. 올바른 IPA가 생성된다고 확신할 수 없는 경우, IP 발음을 포함하는 어휘와 단어만 포함하는 어휘(그리고 선택적으로 표시되는 대로 발음하는 DisplayAs 형식)로 오디오 파일을 처리하여 비교 작업을 수행하십시오. 아무 발음도 제공하지 않는 경우, 해당 서비스는 근사치를 사용하며 이를 통한 결과는 사용자의 입력보다 더 나을 수도 있고 더 나쁠 수도 있습니다.

Q: DisplayAs 형식을 사용할 때 트랜스크립션되는 원래 언어와 관련이 없는 문자 집합을 표시할 수 있습니까(예: “Street”를 “街道“로 출력)?.

예. 구는 특정 언어에 대해 제한적인 문자 집합만 사용할 수도 있지만, DisplayAs 열에는 \t(TAB)를 제외한 모든 UTF-8 문자가 허용됩니다.

요금 및 가용성

Q: 비용은 어떻게 됩니까?

자세한 내용은 Amazon Transcribe 요금 페이지를 참조하십시오.

Q: Amazon Transcribe를 사용할 수 있는 AWS 리전은 어디입니까?

AWS 글로벌 인프라 리전 표를 참조하십시오.

데이터 프라이버시

Q: Amazon Transcribe에서 처리한 음성 입력이 저장됩니까? AWS에서는 이를 어떻게 사용합니까?

Amazon Transcribe는 서비스에서 처리한 음성 입력을 오로지 서비스를 제공 및 유지 관리하고 Amazon Transcribe 및 다른 Amazon 기계 학습/인공 지능 기술의 품질을 개선 및 개발하기 위해서만 저장하고 사용할 수 있습니다. 관련 기술의 개발 및 교육을 비롯하여 Amazon Transcribe 고객 경험을 지속적으로 개선하기 위해서는 고객 콘텐츠를 사용하는 것이 중요합니다. AWS에서는 고객 또는 고객의 최종 사용자를 제품, 서비스 또는 마케팅의 대상으로 삼기 위해 고객의 콘텐츠에 포함되어 있을 수 있는 개인 식별 정보를 사용하지 않습니다. AWS에서는 고객의 신뢰, 개인 정보, 콘텐츠의 보안을 최우선으로 하고 있으며 콘텐츠에 대한 무단 액세스 또는 유출을 방지하기 위해 저장 암호화 및 전송 암호화를 비롯하여 적절하고 정교한 기술적 및 물리적 제어를 구현하고 고객과의 약속을 충실히 준수합니다. 자세한 내용은 https://aws.amazon.com/compliance/data-privacy-faq/를 참조하십시오. AWS Support에 연락하여 Amazon Transcribe 및 기타 Amazon 기계 학습/인공 지능 기술의 품질을 개선 및 개발하기 위해 본인의 콘텐츠를 사용하지 않도록 거부하실 수 있습니다.

Q: Amazon Transcribe에서 저장한 음성 입력을 삭제할 수 있습니까?

예. AWS Support에 문의하여 고객 계정과 연결된 음성 입력을 삭제하도록 요청할 수 있습니다. 음성 입력을 삭제하면 Amazon Transcribe 경험이 저하될 수 있습니다.

Q: Amazon Transcribe에서 처리하고 저장한 내 콘텐츠에 대한 액세스 권한은 누구에게 있습니까?

승인된 직원만 Amazon Transcribe에서 처리한 콘텐츠에 액세스할 수 있습니다. AWS에서는 고객의 신뢰, 개인 정보, 콘텐츠의 보안을 최우선으로 하고 있으며 콘텐츠에 대한 무단 액세스 또는 유출을 방지하기 위해 저장 암호화 및 전송 암호화를 비롯하여 적절하고 정교한 기술적 및 물리적 제어를 구현하고 고객과의 약속을 충실히 준수합니다. 자세한 내용은 https://aws.amazon.com/compliance/data-privacy-faq/를 참조하십시오.

Q: Amazon Transcribe에서 처리하고 저장한 내 콘텐츠는 여전히 내 소유입니까?

사용자는 언제나 자신의 콘텐츠에 대한 소유권을 유지하며 AWS에서는 사용자의 동의가 있을 때만 이를 사용합니다.

Q: Amazon Transcribe에서 처리한 콘텐츠는 내가 Amazon Transcribe를 사용하고 있는 AWS 리전 외부로 이동합니까?

Amazon Transcribe에서 처리한 모든 콘텐츠는 암호화되어 Amazon Transcribe를 사용하고 있는 AWS 리전에 저장됩니다. Amazon Transcribe에서 처리한 콘텐츠 중 일부는 Amazon Transcribe 고객 경험 및 기타 Amazon 기계 학습/인공 지능 기술의 지속적인 개선 및 개발만을 위해 다른 AWS 리전에 저장될 수 있습니다. AWS Support에 연락하여 Amazon Transcribe 및 기타 Amazon 기계 학습/인공 지능 기술의 품질을 개선하기 위해 본인의 콘텐츠를 사용하지 않도록 거부하는 경우, 그러한 콘텐츠는 다른 AWS 리전에 저장되지 않습니다. AWS Support에 문의하여 고객 계정과 연결된 음성 입력을 삭제하도록 요청할 수 있습니다. AWS에서는 고객의 신뢰, 개인 정보, 콘텐츠의 보안을 최우선으로 하고 있으며 콘텐츠에 대한 무단 액세스 또는 유출을 방지하기 위해 저장 중 및 전송 중 암호화를 비롯하여 적절하고 정교한 기술적 및 물리적 제어를 구현하고 고객과의 약속을 충실히 준수합니다. 자세한 내용은 https://aws.amazon.com/compliance/data-privacy-faq/를 참조하십시오.

Q: 13세 미만 어린이를 대상으로 하며 COPPA(Children’s Online Privacy Protection Act)의 적용을 받는 웹 사이트, 프로그램 또는 애플리케이션에 Amazon Transcribe를 사용할 수 있습니까?

예. COPPA에 따라 필요한 알림을 제공하고 필요한 확인 가능한 부모 동의를 제공해야 하는 의무 조항을 비롯한 Amazon Transcribe 서비스 약관을 준수하는 경우, 13세 미만 어린이를 대상(전체 또는 일부)으로 하는 웹 사이트, 프로그램 또는 애플리케이션에 Amazon Transcribe를 사용할 수 있습니다.

Q: 내 웹 사이트, 프로그램 또는 애플리케이션이 COPPA의 적용을 받는지 확인하려면 어떻게 해야 합니까?

COPPA 요구 사항에 대한 정보와 웹 사이트, 프로그램 또는 기타 애플리케이션이 COPPA의 적용을 받는지 확인하기 위한 지침은 미국연방거래위원회에서 제공하고 관리하는 리소스를 직접 참조하시기 바랍니다. 또한, 이 사이트에는 서비스의 대상(전체 또는 일부)이 13세 미만 어린이인지를 확인하는 방법에 대한 정보도 제공되어 있습니다.

Amazon Transcribe 요금에 대해 자세히 알아보십시오

요금 페이지로 이동하기
시작할 준비가 되셨습니까?
Amazon Transcribe 콘솔 사용해 보기
질문이 있으십니까?
AWS에 문의