Amazon Transcribe

Reconocimiento de voz automático

Amazon Transcribe es un servicio de reconocimiento de discurso automático (ASR) que facilita a los desarrolladores agregar capacidades de voz a texto a sus aplicaciones. La API de Amazon Transcribe le permite analizar archivos de audio almacenados en Amazon S3 y recibir un archivo de texto del discurso transcrito.

Amazon Transcribe puede utilizarse en numerosas aplicaciones habituales, incluidas la transcripción de llamadas al servicio de atención al cliente y la generación de subtítulos en contenido de audio y vídeo. El servicio puede transcribir archivos de audio almacenados en formatos habituales, como WAV y MP3, con marcas temporales en cada palabra, para que pueda ubicar fácilmente el audio en la fuente original mediante la búsqueda del texto. Amazon Transcribe aprende y mejora continuamente para seguir el ritmo de evolución del idioma.

Cumbre de AWS en San Francisco 2018 – Amazon Transcribe ya se encuentra disponible de manera general

Características claves

Transcripciones de lectura sencilla

La mayoría de los sistemas de reconocimiento de voz automático genera una cadena de texto sin puntuación. Amazon Transcribe utiliza aprendizaje profundo para añadir formato y signos de puntuación de forma automática, de modo que el resultado es un texto inteligible y que se puede utilizar para cualquier edición posterior.

Generación de marcas temporales

Amazon Transcribe devuelve una marca temporal por cada palabra, lo que le permite localizar fácilmente el sonido en la grabación original mediante la búsqueda del texto.

Compatibilidad para una amplia variedad de casos de uso

Amazon Transcribe está diseñado para suministrar transcripciones precisas y automáticas para una amplia variedad de niveles de calidad de audio. Puede generar subtítulos para cualquier archivo de video o audio, e inclusive transcribir grabaciones de telefonía de baja calidad, como llamadas al servicio de atención al cliente.

Vocabulario personalizado

Amazon Transcribe le permite ampliar y personalizar el vocabulario para el reconocimiento de voz. Puede añadir nuevas palabras al vocabulario base y generar transcripciones de alta precisión específicas para su caso de uso, como nombres de productos, terminología específica del dominio o nombres de personas.

Reconocimiento de varios oradores

Amazon Transcribe es capaz de detectar cuándo hay un cambio de orador y atribuye a cada uno su transcripción adecuadamente. De esta manera, se puede reducir de manera significativa la cantidad de trabajo necesario para transcribir audios con varios oradores, como ocurre en llamadas telefónicas, reuniones y programas de televisión.

Identificación de canales

Amazon Transcribe puede procesar audios y videos en los que cada orador se graba en canales diferentes. Los centros de contacto pueden beneficiarse en gran medida mediante el envío de un único archivo de audio a Amazon Transcribe, que identificará cada canal y producirá una única transcripción marcada con etiquetas de canal.

Casos de uso

Amazon Transcribe puede ofrecer transcripciones en un amplio rango de casos de uso, como el servicio de atención al cliente, la subtitulación, las búsquedas y la conformidad.

Mejora del servicio de atención al cliente

Al convertir entradas de sonido en texto escrito, Amazon Transcribe le permite crear aplicaciones de análisis de textos que pueden realizar búsquedas y análisis de entradas de voz. Los centros de contacto de clientes pueden utilizar Amazon Transcribe para generar transcripciones de interacciones de voz y escarbar los datos en busca de información mediante otros servicios de AWS (como Amazon Comprehend) para extraer significados e intenciones de las conversaciones.

Flujos de trabajo de subtitulación

Amazon Transcribe puede ayudar a los distribuidores de medios y generación de contenidos a mejorar el alcance y el acceso generando automáticamente subtítulos con marcas temporales que aparezcan junto con el contenido del vídeo.

Catálogo de archivos de sonido

Este servicio le permite transcribir recursos de sonido y vídeo y convertirlos en archivos con capacidad completa de búsqueda para la monitorización de conformidad y la administración de riesgos. Los clientes pueden usar Amazon Transcribe para convertir el sonido en texto escrito, y utilizar el servicio Amazon ElasticSearch para indexar y realizar búsquedas de texto en su biblioteca de sonido y video.

Clientes de Amazon Transcribe

Más información sobre los precios de Amazon Transcribe

Visite la página de precios
¿Listo para crear?
Introducción a Amazon Transcribe
¿Tiene más preguntas?
Contacte con nosotros