Características de Amazon Transcribe

Amazon Transcribe es un servicio de reconocimiento automático de voz (ASR) basado en un modelo fundacional de habla que admite más de 100 idiomas. Las características de Transcribe le permiten ingerir entradas de audio, producir transcripciones fáciles de leer y revisar, mejorar la precisión con la personalización y filtrar el contenido para garantizar la privacidad de los clientes.

Entradas de audio

Transcribe está diseñado para procesar entradas de audio o video en directo y grabadas a fin de proporcionar transcripciones de alta calidad para la búsqueda y el análisis. También ofrecemos API independientes que comprenden de forma exclusiva las llamadas de los clientes (Amazon Transcribe Call Analytics) y las conversaciones médicas (Amazon Transcribe Medical).

Transmisión y transcripción por lotes

Puede procesar sus grabaciones de audio existentes o transmitir el audio para su transcripción en tiempo real. Mediante una conexión segura, puede enviar una secuencia de audio en vivo al servicio, y recibirá como respuesta una secuencia de texto en tiempo real.

Modelos específicos de dominio

Seleccione un modelo que esté ajustado para llamadas telefónicas o contenido de video multimedia. Por ejemplo, Transcribe se adapta al audio telefónico de baja fidelidad común en los centros de contacto.

Identificación automática del idioma

Con Amazon Transcribe, puede identificar automáticamente el idioma dominante en un archivo de audio y generar transcripciones. Esto resulta útil cuando la biblioteca multimedia contiene archivos de audio en diferentes idiomas. También puede usar esta característica para clasificar el contenido multimedia y comprobar que el idioma principal hablado en sus videos y podcasts esté etiquetado correctamente.

Transcripciones fáciles de leer

Amazon Transcribe le permite producir transcripciones precisas que son fáciles de leer, revisar e integrar en sus aplicaciones específicas. Trabajamos para preparar el resultado para actividades posteriores, como el análisis de transcripciones de llamadas, la subtitulación y la búsqueda de contenido.

Normalización de signos de puntuación y números

Amazon Transcribe agrega automáticamente signos de puntuación y formato de números para que el resultado tenga la calidad de una transcripción manual a una fracción del tiempo y de los gastos. Los números también se transcriben en dígitos o en “forma normal” en lugar de palabras.

Generación de marcas temporales

Amazon Transcribe devuelve una marca temporal por cada palabra, lo que le permite localizar fácilmente una palabra o frase en la grabación original o añadir subtítulos a un video.

Reconocimiento de varios oradores

Los cambios de oradores se reconocen automáticamente y se atribuyen en el texto para identificar con precisión casos de uso como llamadas telefónicas, reuniones y programas de televisión. Para obtener más información sobre la identificación de hablantes.

Identificación de canales

Los centros de contacto pueden enviar un solo archivo de audio a Amazon Transcribe y el servicio elaborará automáticamente una sola transcripción con comentarios según las etiquetas de los canales.

Personalice su salida

La precisión es fundamental y le ofrecemos muchas opciones para personalizar las transcripciones según sus necesidades empresariales específicas y su lengua vernácula. Transcribe también ofrece hasta 10 transcripciones alternativas para cada oración, de modo que puedas elegir rápidamente la mejor opción que se adapte a tu contenido y dominio. Esto es útil para los flujos de trabajo de subtitulación continua humanos.

Vocabulario personalizado

Con el vocabulario puede agregar nuevas palabras al vocabulario base y generar transcripciones más precisas para palabras y frases de un dominio específico, como nombres de productos, terminología técnica o nombres de personas.

Modelos de lenguaje personalizado

Cuando sea necesario, puede crear y entrenar su propio modelo de lenguaje personalizado (CLM) para su caso de uso y dominio mediante el envío de un corpus de datos de texto a Amazon Transcribe. El CLM es una característica adecuada para mejorar la precisión del reconocimiento de voz con sus propios datos.

Características de seguridad y privacidad del usuario

Garantizar la privacidad y la seguridad de los clientes es fundamental. Cuando sea necesario, Transcribe puede ayudarlo a enmascarar o eliminar palabras delicadas o inadecuadas para su audiencia de los resultados de la transcripción.

Filtrado de vocabulario

Puede especificar una lista de palabras que se deben eliminar de las transcripciones con el filtrado de vocabulario. Por ejemplo, puede especificar una lista de palabras profanas u ofensivas y Amazon Transcribe las eliminará de las transcripciones de forma automática.

Características de seguridad y privacidad del usuario

Censura automática de contenidos o información de identificación personal

Cuando se le indique, Amazon Transcribe puede ayudar a los clientes identificar y censurar información de identificación personal (PII) de las transcripciones de idiomas admitidos. Esto les permite a los centros de atención examinar y compartir con facilidad las transcripciones de la información de la experiencia del cliente y la formación técnica del agente.

Protección de los datos

Proteja los datos en reposo con la clave Amazon S3 (SSE-S3) o especifique su propia clave de AWS Key Management Service. Amazon Transcribe utiliza TLS (Transport Layer Security) 1.2, un protocolo criptográfico que permite conexiones autenticadas y el transporte seguro de datos a través de Internet a través de HTTP, con certificados de AWS para cifrar los datos en tránsito. Esto incluye la transmisión de transcripciones.

Detección de contenido de audio tóxico

Amazon Transcribe Toxicity Detection utiliza machine learning para mantener conversaciones de audio civilizadas y constructivas a fin de fomentar un entorno en línea seguro e inclusivo. El contenido de audio tóxico se clasifica en una de varias categorías para que los moderadores humanos lo identifiquen fácilmente y tomen las medidas adecuadas.

Amazon Transcribe Call Analytics

Extraiga información de las conversaciones, como el sentimiento de las llamadas y el volumen de la voz, para mejorar la productividad de los agentes y la experiencia del cliente con Amazon Transcribe Call Analytics.

Mejore la productividad en los centros de contacto con la creación de resúmenes de llamadas basada en IA generativa

Genere resúmenes de llamadas automáticamente para ayudar a los agentes a centrarse en ofrecer excelentes experiencias a los clientes y aumentar la productividad al reducir la creación de resúmenes manual después de la llamada. Esta capacidad resume la interacción con la persona que llama y captura los componentes clave, como el motivo de la llamada, las medidas adoptadas para resolver el problema y los pasos siguientes. Los supervisores del centro de contacto pueden revisar los resúmenes de las llamadas para comprender rápidamente el contexto de una interacción sin tener que leer toda la transcripción mientras investigan los problemas de la persona que llama.

Extraiga análisis detallados de las llamadas e información sobre las conversaciones

Gracias a las posibilidades que ofrece el machine learning, podrá aplicar rápidamente las capacidades de conversión de voz a texto y procesamiento de lenguaje natural (NLP) durante las llamadas en directo y obtener información valiosa de la conversación. Así podrá integrar en las aplicaciones de análisis de llamadas entrantes y salientes datos, como la opinión de los clientes y los agentes, los problemas detectados y las características de la conversación, como el tiempo sin hablar, las interrupciones y la velocidad de conversación. Esto puede ayudar a los supervisores a identificar más fácilmente posibles problemas que tengan los clientes, oportunidades de formación para los agentes y tendencias de las llamadas.

Mejore el cumplimiento y la supervisión gracias a la categorización automatizada de las llamadas

Supervise las llamadas a escala para realizar un seguimiento del cumplimiento de las políticas de la empresa o de los requisitos regulatorios. Cree y entrene categorías personalizadas propias en función de criterios que especifique (como palabras/frases o características de la conversación). Por ejemplo, puede establecer etiquetas de categoría para ver qué porcentaje de llamadas corresponden a ventas adicionales o a cancelación de cuentas.

Produzca transcripciones de llamadas completas

Proporcione a sus agentes acceso a los detalles de las conversaciones de interacciones anteriores. Las transcripciones paso a paso proporcionan información como la opinión de los clientes, los problemas detectados y las interrupciones.

Proteja los datos confidenciales de los clientes

Las conversaciones con frecuencia contienen datos confidenciales de los clientes, como nombres, direcciones, números de tarjetas de crédito y números de la seguridad social. Transcribe Call Analytics ayuda a los clientes a identificar y redactar esta información a partir tanto del audio como del texto.

Integraciones del centro de contacto

Genesys Cloud CX
Genesys Cloud CX es una solución de centro de contacto en la nube que unifica las experiencias de los clientes y agentes a través de múltiples canales, como teléfono, mensajes de texto y chat. Puede transmitir el audio de su llamada a Amazon Transcribe desde el entorno de Genesys Cloud para mejorar la productividad de los agentes y extraer información sobre la interacción con los clientes. Consulte Integración de Genesys Cloud AudioHook para obtener más información. Además, comience a analizar sus llamadas de Genesys Cloud con la solución AWS Live Call Analytics.

SDK de Amazon Chime
El SDK de Amazon Chime es un conjunto de componentes de comunicaciones en tiempo real que los desarrolladores pueden utilizar para agregar con rapidez llamadas de audio, videollamadas y funciones de pantalla compartida a sus propias aplicaciones de telefonía, web o móviles.

Amazon Chime Voice Connector
El conector de voz de Amazon Chime le permite integrarse fácilmente con centros de contacto basados en SIP para generar transcripciones en tiempo real atribuidas por los usuarios con Amazon Transcribe. Consulte la documentación de Amazon Chime Voice Connector para obtener más información.

Amazon Transcribe Medical

Especialidades médicas

Transcriba fácilmente sus conversaciones médicas con Transcribe Medical, un servicio de reconocimiento automático de voz (ASR) que cumple con los requisitos de la HIPAA.

Modo de dictado

Transcriba con precisión el audio de un solo altavoz que se encuentra comúnmente en los casos de uso de dictados médicos. Más información »

Modo conversacional

Transcriba con precisión el audio conversacional de varios altavoces compuesto por médicos o pacientes por igual. Más información »

Transcriba voz a texto en una amplia gama de especialidades médicas. Más información »

API para lotes

Transcriba archivos de audio médicos grabados a escala con alta simultaneidad. Más información »

API de streaming

Transcriba transmisiones de audio casi en tiempo real mediante los protocolos WebSocket Secure o HTTP/2. Más información »

Vocabulario personalizado

Aumente la precisión de la transcripción mediante el uso de vocabulario personalizado para terminología que podría estar fuera del léxico. Más información »

Identificación de canales

Transcriba audio multicanal de forma simultánea sin costo adicional. Obtenga una transcripción final coherente. Más información »

Diarización de altavoces

Separe la voz de los distintos altavoces dentro de cualquier audio monocanal. Más información »

Más información sobre los precios de los productos

Visite la página de precios de Amazon Transcribe.

Más información

Regístrese para obtener una cuenta gratuita

Obtenga acceso instantáneo a la capa gratuita de AWS.

Registrarse

Comience a crear en la consola

Comience a crear con Amazon Transcribe en la consola de administración de AWS.

Inicie sesión

Características de Amazon Transcribe

Entradas de audio

Transmisión y transcripción por lotes

Modelos específicos de dominio

Identificación automática del idioma

Transcripciones fáciles de leer

Normalización de signos de puntuación y números

Generación de marcas temporales

Reconocimiento de varios oradores

Identificación de canales

Personalice su salida

Vocabulario personalizado

Modelos de lenguaje personalizado

Características de seguridad y privacidad del usuario

Filtrado de vocabulario

Censura automática de contenidos o información de identificación personal

Protección de los datos

Detección de contenido de audio tóxico

Amazon Transcribe Call Analytics

Mejore la productividad en los centros de contacto con la creación de resúmenes de llamadas basada en IA generativa

Extraiga análisis detallados de las llamadas e información sobre las conversaciones

Mejore el cumplimiento y la supervisión gracias a la categorización automatizada de las llamadas

Produzca transcripciones de llamadas completas

Proteja los datos confidenciales de los clientes

Integraciones del centro de contacto

Amazon Transcribe Medical

Especialidades médicas

Modo de dictado

Modo conversacional

API para lotes

API de streaming

Vocabulario personalizado

Identificación de canales

Diarización de altavoces

Finalización de la compatibilidad con Internet Explorer