Crear una transcripción de audio

con Amazon Transcribe

En este tutorial paso a paso, aprenderá a usar Amazon Transcribe para crear una transcripción de texto de un archivo de audio grabado mediante la consola de administración de AWS. Amazon Transcribe es un servicio de reconocimiento de voz automático (ASR) que facilita a los desarrolladores la adición de prestaciones de conversión de voz a texto a sus aplicaciones. La API de Amazon Transcribe permite analizar archivos de audio almacenados en Amazon Simple Storage Service (S3) y recibir un archivo de texto del discurso transcrito.

Como desarrollador, crear transcripciones de llamadas de servicio de clientes o generar subtítulos para contenido de audio y video son retos habituales que requieren capacidades de conversión de voz a texto. Podría hacer frente a este reto creando sus propios modelos de aprendizaje automático desde cero. Sin embargo, esta opción requiere mucho tiempo, resulta cara y necesita experiencia en aprendizaje automático. En lugar de tomar el camino difícil, puede usar Amazon Transcribe, un servicio previamente entrenado y completamente administrado que proporciona transcripciones rápidas y de gran calidad.

En este tutorial, descargará un archivo de audio de muestra y, después, lo cargará en un bucket de S3 que tendrá que crear. Posteriormente, usará Amazon Transcribe para crear una transcripción a partir del clip de audio de muestra mediante la consola de administración de AWS.

Este tutorial es una demostración de la funcionalidad que se encuentra disponible mediante la CLI de AWS o la API de Transcribe. Para realizar implementaciones de pruebas de concepto o producción, se recomienda utilizar estas interfaces de programación en vez de la consola de Amazon Transcribe.

Es necesario disponer de una cuenta de AWS para realizar este tutorial

Es fácil empezar a trabajar con la capa gratuita de Amazon Transcribe. Transcriba hasta 60 minutos de audio al mes, de forma gratuita durante los primeros 12 meses desde la creación de su cuenta de AWS.

Más información sobre la capa gratuita >>


Paso 1. Crear un bucket de S3 y cargar un archivo de audio de muestra

En este paso, descargará un archivo de audio de muestra, creará un bucket de S3 y, después, cargará el archivo de muestra en el bucket de S3. Transcribe solo puede tener acceso a archivos de audio y video para la transcripción desde buckets de S3.


a.  Cuando haga clic aquí, se descargará el archivo de audio de muestra que se transcribirá posteriormente en el tutorial. El nombre del archivo es transcribe-sample.mp3.


b.  Cuando haga clic aquí, se abrirá la consola de administración de AWS en una ventana nueva del navegador para que pueda seguir teniendo abierta esta guía paso a paso. Cuando la pantalla se cargue, escriba su nombre de usuario y contraseña para comenzar. Mediante la lista desplegable Región, seleccione una región donde esté disponible Amazon Transcribe.

Actualmente, Amazon Transcribe está disponible en las regiones EE.UU. Este (Norte de Virginia), EE.UU. Este (Ohio), EE.UU. Oeste (Oregón), Asia Pacífico (Sídney), Canadá (Central) y UE (Irlanda).

create-audio-transcript-transcribe-step-1b

(Haga clic para ampliar).


c. Escriba S3 en la barra de búsqueda y seleccione S3 para abrir la consola.

create-audio-transcript-transcribe-step-1c

(Haga clic para ampliar).


d.  En el panel de S3, elija Crear bucket.

Si es la primera vez que crea un bucket, verá una pantalla similar a la imagen que se muestra aquí.

Si ya creó buckets de S3 con anterioridad, el panel de S3 incluirá todos los buckets creados.

create-audio-transcript-transcribe-step-1d

(Haga clic para ampliar).


e.  Escriba un nombre exclusivo para el bucket. Los nombres de buckets no se pueden repetir en Amazon S3. También existen otras restricciones acerca de los nombres de buckets de S3. A continuación, seleccione una región para crear el bucket.

Seleccione Siguiente.

create-audio-transcript-transcribe-step-1e

(Haga clic para ampliar).


f.  Existen muchas opciones útiles para el bucket de S3, que incluyen Control de versiones, Registro de acceso al servidor, Etiquetas, Registro a nivel de objetos y Cifrado predeterminado. No activaremos esas características para este tutorial.

Seleccione Siguiente.

create-audio-transcript-transcribe-step-1f

(Haga clic para ampliar).


g.  En este paso, existe la posibilidad de ajustar la configuración de los permisos para el bucket de S3 durante su proceso de creación.

Deje los valores predeterminados y seleccione Siguiente.

create-audio-transcript-transcribe-step-1g

(Haga clic para ampliar).


h.  Revise los ajustes de configuración y seleccione Crear bucket.

create-audio-transcript-transcribe-step-1h

(Haga clic para ampliar).


i.  Verá el nuevo bucket en la consola de S3. Haga clic en el nombre del bucket para ir hasta él. El nombre del bucket no será el mismo que aparece en la captura de pantalla de la derecha.

create-audio-transcript-transcribe-step-1i

(Haga clic para ampliar).


j. Se encuentra en la página de inicio del bucket.

Seleccione Cargar.

create-audio-transcript-transcribe-step-1j

(Haga clic para ampliar).


k.  Cargue el archivo transcribe-sample.mp3; para ello, seleccione Agregar archivos y seleccione el archivo, O BIEN arrastre y suelte el archivo transcribe-sample.mp3 en el cuadro de carga.

Seleccione Cargar.

create-audio-transcript-transcribe-step-1k

(Haga clic para ampliar).


l.  Seleccione la casilla de verificación situada junto al archivo transcribe-sample.mp3 en el bucket. Aparecerá un panel de detalles sobre el archivo transcribe-sample.mp3. Copie el enlace al archivo y guárdelo para su uso posterior en el tutorial.

create-audio-transcript-transcribe-step-1l

(Haga clic para ampliar).


Paso 2. Crear el trabajo de transcripción

En este paso, creará y ejecutará un trabajo de transcripción mediante la consola de Amazon Transcribe.


a.  En la barra de menús superior, seleccione Servicios, empiece a escribir Transcribe en la barra de búsqueda y seleccione Amazon Transcribe para abrir la consola del servicio.

create-audio-transcript-transcribe-step-2a

(Haga clic para ampliar).


b.  En la página principal de la consola de Amazon Transcribe, abra el panel de navegación y haga clic en Trabajos de transcripción.

c. En la página Trabajos de transcripción, haga clic en Crear trabajo.

create-audio-transcript-transcribe-step-2b

(Haga clic para ampliar).


d.  En la página Crear trabajo de transcripción, en el campo Nombre, escriba sample-transcription-job.

Deje el Idioma predeterminado como Inglés.

En el campo Ubicación del archivo de origen en S3, pegue el enlace al archivo de muestra del bucket de S3. El enlace al archivo de muestra será distinto del que se muestra en la captura de pantalla de la derecha.  

Deje el Formato predeterminado como mp3.

Puede usar la característica Vocabulario personalizado para ayudar a Amazon Translate a reconocer las palabras y las expresiones específicas de su aplicación; por ejemplo, un nombre no inglés como Etienne. No utilizará esta característica en este tutorial.

create-audio-transcript-transcribe-step-2c

(Haga clic para ampliar).


e.  Deje la Ubicación de los datos predeterminada como Predeterminada de Amazon.

Si habilita Identificación de canales, Amazon Transcribe puede procesar audio y video en los que cada orador está grabado en distintos canales, y producir una única transcripción con etiquetas anotadas por canal.

Si habilita Identificación del orador, Amazon Transcribe reconocerá cuándo hay un cambio de orador y atribuirá el texto transcrito adecuadamente.

Ninguna de estas opciones se utilizan en este tutorial.

Seleccione Crear para iniciar su trabajo de transcripción.  

create-audio-transcript-transcribe-step-2d

(Haga clic para ampliar).


Paso 3. Revisar los resultados de la transcripción

En este paso, aprenderá cómo comprobar el progreso del trabajo de transcripción y revisar los resultados.


a.  Después de hacer clic en el botón Crear, aparecerá la pantalla Trabajos de transcripción. En ella, se mostrará el estado de sample-transcription-job. El estado puede ser En progreso, Completo o Error.

Cuando el estado sea Completo, haga clic en el enlace de sample-transcription-job en la columna Nombre para ver los resultados de la transcripción.

create-audio-transcript-transcribe-step-3a

(Haga clic para ampliar).


b.   A continuación, verá los detalles de sample-transcription-job. Desplácese hacia abajo hasta el panel Transcripción para ver la salida del trabajo de transcripción. En el panel JSON, puede ver los resultados de la transcripción como los devolvería la API de Transcribe o la CLI de AWS.

create-audio-transcript-transcribe-step-3b

(Haga clic para ampliar).


Paso 4. Terminar los recursos

En este paso, eliminará el archivo de muestra del bucket de S3 para evitar cargos innecesarios.


a.  En este menú de navegación superior, haga clic en Servicios, comience a escribir S3 en la barra de búsqueda y seleccione S3 para abrir la consola.

create-audio-transcript-transcribe-step-4a

(Haga clic para ampliar).


b.  Desplácese por sus buckets de S3 y localice el bucket que creó anteriormente en este tutorial. Haga clic en el nombre de este bucket para ver su contenido. El nombre de su bucket será distinto del mostrado en la captura de pantalla de la derecha.

create-audio-transcript-transcribe-step-4b

(Haga clic para ampliar).


c.  Seleccione el archivo transcribe-sample.mp3 contenido en el bucket y, en el menú Acciones, seleccione Eliminar. Confirme la eliminación.

create-audio-transcript-transcribe-step-4c

(Haga clic para ampliar).


¡Felicitaciones!

Como ha podido ver en este tutorial, Amazon Transcribe permite convertir la voz en texto a escala. Use Amazon Transcribe para una amplia gama de archivos de audio o video, como llamadas de servicio de clientes, reuniones de empresa, transmisiones de televisión y videos bajo demanda.

 

Aprenda a traducir texto a escala

Descubra cómo traducir transcripciones de texto a otro idioma mediante Amazon Translate en este tutorial de 10 minutos.

Introducción a la API y la CLI de Transcribe

Aprenda cómo usar la API y la CLI de Amazon Transcribe con este tutorial incluido en la documentación.

Explore Amazon Comprehend

Aprenda cómo analizar opiniones en el texto mediante Amazon Comprehend con este tutorial de 10 minutos.

 


¿Le resultó útil este tutorial?