Crear una transcripción de audio
con Amazon Transcribe
En este tutorial paso a paso, aprenderá a usar Amazon Transcribe para crear una transcripción de texto de un archivo de audio grabado mediante la consola de administración de AWS. Amazon Transcribe es un servicio de reconocimiento de voz automático (ASR) que facilita a los desarrolladores la adición de prestaciones de conversión de voz a texto a sus aplicaciones. La API de Amazon Transcribe permite analizar archivos de audio almacenados en Amazon Simple Storage Service (S3) y recibir un archivo de texto del discurso transcrito.
Como desarrollador, crear transcripciones de llamadas de servicio de clientes o generar subtítulos para contenido de audio y video son retos habituales que requieren capacidades de conversión de voz a texto. Podría hacer frente a este reto creando sus propios modelos de aprendizaje automático desde cero. Sin embargo, esta opción requiere mucho tiempo, resulta cara y necesita experiencia en aprendizaje automático. En lugar de tomar el camino difícil, puede usar Amazon Transcribe, un servicio previamente entrenado y completamente administrado que proporciona transcripciones rápidas y de gran calidad.
En este tutorial, descargará un archivo de audio de muestra y, después, lo cargará en un bucket de S3 que tendrá que crear. Posteriormente, usará Amazon Transcribe para crear una transcripción a partir del clip de audio de muestra mediante la consola de administración de AWS.
Este tutorial es una demostración de la funcionalidad que se encuentra disponible mediante la CLI de AWS o la API de Transcribe. Para realizar implementaciones de pruebas de concepto o producción, se recomienda utilizar estas interfaces de programación en vez de la consola de Amazon Transcribe.
Es necesario disponer de una cuenta de AWS para realizar este tutorial
Es fácil empezar a trabajar con la capa gratuita de Amazon Transcribe. Transcriba hasta 60 minutos de audio al mes, de forma gratuita durante los primeros 12 meses desde la creación de su cuenta de AWS.
Paso 1. Crear un bucket de S3 y cargar un archivo de audio de muestra
En este paso, descargará un archivo de audio de muestra, creará un bucket de S3 y, después, cargará el archivo de muestra en el bucket de S3. Transcribe solo puede tener acceso a archivos de audio y video para la transcripción desde buckets de S3.
a. Cuando haga clic aquí, se descargará el archivo de audio de muestra que se transcribirá posteriormente en el tutorial. El nombre del archivo es transcribe-sample.mp3.
b. Cuando haga clic aquí, se abrirá la consola de administración de AWS en una ventana nueva del navegador para que pueda seguir teniendo abierta esta guía paso a paso. Cuando la pantalla se cargue, escriba su nombre de usuario y contraseña para comenzar. Mediante la lista desplegable Región, seleccione una región donde esté disponible Amazon Transcribe.
Actualmente, Amazon Transcribe está disponible en las regiones EE.UU. Este (Norte de Virginia), EE.UU. Este (Ohio), EE.UU. Oeste (Oregón), Asia Pacífico (Sídney), Canadá (Central) y UE (Irlanda).
e. Escriba un nombre exclusivo para el bucket. Los nombres de buckets no se pueden repetir en Amazon S3. También existen otras restricciones acerca de los nombres de buckets de S3. A continuación, seleccione una región para crear el bucket.
Seleccione Siguiente.
f. Existen muchas opciones útiles para el bucket de S3, que incluyen Control de versiones, Registro de acceso al servidor, Etiquetas, Registro a nivel de objetos y Cifrado predeterminado. No activaremos esas características para este tutorial.
Seleccione Siguiente.
Paso 2. Crear el trabajo de transcripción
En este paso, creará y ejecutará un trabajo de transcripción mediante la consola de Amazon Transcribe.
d. En la página Crear trabajo de transcripción, en el campo Nombre, escriba sample-transcription-job.
Deje el Idioma predeterminado como Inglés.
En el campo Ubicación del archivo de origen en S3, pegue el enlace al archivo de muestra del bucket de S3. El enlace al archivo de muestra será distinto del que se muestra en la captura de pantalla de la derecha.
Deje el Formato predeterminado como mp3.
Puede usar la característica Vocabulario personalizado para ayudar a Amazon Translate a reconocer las palabras y las expresiones específicas de su aplicación; por ejemplo, un nombre no inglés como Etienne. No utilizará esta característica en este tutorial.
e. Deje la Ubicación de los datos predeterminada como Predeterminada de Amazon.
Si habilita Identificación de canales, Amazon Transcribe puede procesar audio y video en los que cada orador está grabado en distintos canales, y producir una única transcripción con etiquetas anotadas por canal.
Si habilita Identificación del orador, Amazon Transcribe reconocerá cuándo hay un cambio de orador y atribuirá el texto transcrito adecuadamente.
Ninguna de estas opciones se utilizan en este tutorial.
Seleccione Crear para iniciar su trabajo de transcripción.
Paso 3. Revisar los resultados de la transcripción
En este paso, aprenderá cómo comprobar el progreso del trabajo de transcripción y revisar los resultados.
a. Después de hacer clic en el botón Crear, aparecerá la pantalla Trabajos de transcripción. En ella, se mostrará el estado de sample-transcription-job. El estado puede ser En progreso, Completo o Error.
Cuando el estado sea Completo, haga clic en el enlace de sample-transcription-job en la columna Nombre para ver los resultados de la transcripción.
b. A continuación, verá los detalles de sample-transcription-job. Desplácese hacia abajo hasta el panel Transcripción para ver la salida del trabajo de transcripción. En el panel JSON, puede ver los resultados de la transcripción como los devolvería la API de Transcribe o la CLI de AWS.
Paso 4. Terminar los recursos
En este paso, eliminará el archivo de muestra del bucket de S3 para evitar cargos innecesarios.
¡Felicitaciones!
Como ha podido ver en este tutorial, Amazon Transcribe permite convertir la voz en texto a escala. Use Amazon Transcribe para una amplia gama de archivos de audio o video, como llamadas de servicio de clientes, reuniones de empresa, transmisiones de televisión y videos bajo demanda.
Siguiente actividad recomendada:
Aprenda a traducir texto a escala
Descubra cómo traducir transcripciones de texto a otro idioma mediante Amazon Translate en este tutorial de 10 minutos.
Introducción a la API y la CLI de Transcribe
Aprenda cómo usar la API y la CLI de Amazon Transcribe con este tutorial incluido en la documentación.
Explore Amazon Comprehend
Aprenda cómo analizar opiniones en el texto mediante Amazon Comprehend con este tutorial de 10 minutos.