Amazon Transcribe

Reconocimiento de voz automático

Amazon Transcribe es un servicio de reconocimiento de discurso automático (ASR) que facilita a los desarrolladores agregar capacidades de voz a texto a sus aplicaciones. La API de Amazon Transcribe le permite analizar archivos de audio almacenados en Amazon S3 y recibir un archivo de texto del discurso transcrito.

Amazon Transcribe puede utilizarse en numerosas aplicaciones habituales, incluidas la transcripción de llamadas al servicio de atención al cliente y la generación de subtítulos en contenido de audio y vídeo. El servicio puede transcribir archivos de audio almacenados en formatos habituales, como WAV y MP3, con marcas temporales en cada palabra, para que pueda ubicar fácilmente el audio en la fuente original mediante la búsqueda del texto. Amazon Transcribe aprende y mejora continuamente para seguir el ritmo de evolución del idioma.

AWS re:Invent 2017 presenta Amazon Transcribe

Características principales

API de uso sencillo

La API de Amazon Transcribe facilita la conversión de voz a texto escrito. No hace falta ningún tipo de programación compleja. Solo tiene que realizar una llamada a la API con unas líneas de código, tras lo cual Amazon Transcribe le devolverá el texto a partir de su archivo de sonido almacenado en Amazon S3.

Compatibilidad para una amplia variedad de casos de uso

Amazon Transcribe está diseñado para suministrar transcripciones precisas y automáticas para una amplia variedad de niveles de calidad de audio. Puede generar subtítulos para cualquier archivo de video o audio, e inclusive transcribir grabaciones de telefonía de baja calidad, como llamadas al servicio de atención al cliente.

 

Transcripciones de lectura sencilla

La mayoría de los sistemas de reconocimiento de voz automático genera una cadena de texto sin puntuación. Amazon Transcribe utiliza aprendizaje profundo para añadir formato y signos de puntuación de forma automática, de modo que el resultado es un texto inteligible y que se puede utilizar para cualquier edición posterior.

Vocabulario personalizado

Amazon Transcribe le permite ampliar y personalizar el vocabulario para el reconocimiento de voz. Puede añadir nuevas palabras al vocabulario base y generar transcripciones de alta precisión específicas para su caso de uso, como nombres de productos, terminología específica del dominio o nombres de personas.

Generación de marcas temporales

Amazon Transcribe devuelve una marca temporal por cada palabra, lo que le permite localizar fácilmente el sonido en la grabación original mediante la búsqueda del texto.

 

Reconocimiento de varios oradores

Amazon Transcribe es capaz de detectar cuándo hay un cambio de orador y atribuye a cada uno su transcripción adecuadamente. De esta manera, se puede reducir de manera significativa la cantidad de trabajo necesario para transcribir audios con varios oradores, como ocurre en llamadas telefónicas, reuniones y programas de televisión.

Casos de uso

Amazon Transcribe puede ofrecer transcripciones en un amplio rango de casos de uso, como el servicio de atención al cliente, la subtitulación, las búsquedas y la conformidad.

Mejora del servicio de atención al cliente

Al convertir entradas de sonido en texto escrito, Amazon Transcribe le permite crear aplicaciones de análisis de textos que pueden realizar búsquedas y análisis de entradas de voz. Los centros de contacto de clientes pueden utilizar Amazon Transcribe para generar transcripciones de interacciones de voz y escarbar los datos en busca de información mediante otros servicios de AWS (como Amazon Comprehend) para extraer significados e intenciones de las conversaciones.

Flujos de trabajo de subtitulación

Amazon Transcribe puede ayudar a los distribuidores de medios y generación de contenidos a mejorar el alcance y el acceso generando automáticamente subtítulos con marcas temporales que aparezcan junto con el contenido del vídeo.

Catálogo de archivos de sonido

Este servicio le permite transcribir recursos de sonido y vídeo y convertirlos en archivos con capacidad completa de búsqueda para la monitorización de conformidad y la administración de riesgos. Los clientes pueden usar Amazon Transcribe para convertir el sonido en texto escrito, y utilizar el servicio Amazon ElasticSearch para indexar y realizar búsquedas de texto en su biblioteca de sonido y video.

Clientes de Amazon Transcribe

Más información sobre los precios de Amazon Transcribe

Visite la página de precios
¿Listo para crear?
Introducción a Amazon Transcribe
¿Tiene más preguntas?
Contacte con nosotros