Amazon Transcribe es un servicio de reconocimiento automático de voz (ASR) basado en un modelo fundacional de habla que admite más de 100 idiomas. Las características de Transcribe le permiten ingerir entradas de audio, producir transcripciones fáciles de leer y revisar, mejorar la precisión con la personalización y filtrar el contenido para garantizar la privacidad de los clientes.
Entradas de audio
Transcribe está diseñado para procesar entradas de audio o video en directo y grabadas a fin de proporcionar transcripciones de alta calidad para la búsqueda y el análisis. También ofrecemos API independientes que comprenden de forma exclusiva las llamadas de los clientes (Amazon Transcribe Call Analytics) y las conversaciones médicas (Amazon Transcribe Medical).
Transmisión y transcripción por lotes
Puede procesar sus grabaciones de audio existentes o transmitir el audio para su transcripción en tiempo real. Mediante una conexión segura, puede enviar una secuencia de audio en vivo al servicio, y recibirá como respuesta una secuencia de texto en tiempo real.
Modelos específicos de dominio
Seleccione un modelo que esté ajustado para llamadas telefónicas o contenido de video multimedia. Por ejemplo, Transcribe se adapta al audio telefónico de baja fidelidad común en los centros de contacto.
Identificación automática del idioma
Con Amazon Transcribe, puede identificar automáticamente el idioma dominante en un archivo de audio y generar transcripciones. Esto resulta útil cuando la biblioteca multimedia contiene archivos de audio en diferentes idiomas. También puede usar esta característica para clasificar el contenido multimedia y comprobar que el idioma principal hablado en sus videos y podcasts esté etiquetado correctamente.
Transcripciones fáciles de leer
Amazon Transcribe le permite producir transcripciones precisas que son fáciles de leer, revisar e integrar en sus aplicaciones específicas. Trabajamos para preparar el resultado para actividades posteriores, como el análisis de transcripciones de llamadas, la subtitulación y la búsqueda de contenido.
Normalización de signos de puntuación y números
Amazon Transcribe agrega automáticamente signos de puntuación y formato de números para que el resultado tenga la calidad de una transcripción manual a una fracción del tiempo y de los gastos. Los números también se transcriben en dígitos o en “forma normal” en lugar de palabras.
Generación de marcas temporales
Amazon Transcribe devuelve una marca temporal por cada palabra, lo que le permite localizar fácilmente una palabra o frase en la grabación original o añadir subtítulos a un video.
Reconocimiento de varios oradores
Los cambios de oradores se reconocen automáticamente y se atribuyen en el texto para identificar con precisión casos de uso como llamadas telefónicas, reuniones y programas de televisión. Para obtener más información sobre la identificación de hablantes.
Identificación de canales
Los centros de contacto pueden enviar un solo archivo de audio a Amazon Transcribe y el servicio elaborará automáticamente una sola transcripción con comentarios según las etiquetas de los canales.
Personalice su salida
La precisión es fundamental y le ofrecemos muchas opciones para personalizar las transcripciones según sus necesidades empresariales específicas y su lengua vernácula. Transcribe también ofrece hasta 10 transcripciones alternativas para cada oración, de modo que puedas elegir rápidamente la mejor opción que se adapte a tu contenido y dominio. Esto es útil para los flujos de trabajo de subtitulación continua humanos.
Vocabulario personalizado
Con el vocabulario puede agregar nuevas palabras al vocabulario base y generar transcripciones más precisas para palabras y frases de un dominio específico, como nombres de productos, terminología técnica o nombres de personas.
Modelos de lenguaje personalizado
Cuando sea necesario, puede crear y entrenar su propio modelo de lenguaje personalizado (CLM) para su caso de uso y dominio mediante el envío de un corpus de datos de texto a Amazon Transcribe. El CLM es una característica adecuada para mejorar la precisión del reconocimiento de voz con sus propios datos.
Características de seguridad y privacidad del usuario
Garantizar la privacidad y la seguridad de los clientes es fundamental. Cuando sea necesario, Transcribe puede ayudarlo a enmascarar o eliminar palabras delicadas o inadecuadas para su audiencia de los resultados de la transcripción.
Filtrado de vocabulario
Puede especificar una lista de palabras que se deben eliminar de las transcripciones con el filtrado de vocabulario. Por ejemplo, puede especificar una lista de palabras profanas u ofensivas y Amazon Transcribe las eliminará de las transcripciones de forma automática.
Censura automática de contenidos o información de identificación personal
Cuando se le indique, Amazon Transcribe puede ayudar a los clientes identificar y censurar información de identificación personal (PII) de las transcripciones de idiomas admitidos. Esto les permite a los centros de atención examinar y compartir con facilidad las transcripciones de la información de la experiencia del cliente y la formación técnica del agente.
Protección de los datos
Proteja los datos en reposo con la clave Amazon S3 (SSE-S3) o especifique su propia clave de AWS Key Management Service. Amazon Transcribe utiliza TLS (Transport Layer Security) 1.2, un protocolo criptográfico que permite conexiones autenticadas y el transporte seguro de datos a través de Internet a través de HTTP, con certificados de AWS para cifrar los datos en tránsito. Esto incluye la transmisión de transcripciones.
Detección de contenido de audio tóxico
Amazon Transcribe Toxicity Detection utiliza machine learning para mantener conversaciones de audio civilizadas y constructivas a fin de fomentar un entorno en línea seguro e inclusivo. El contenido de audio tóxico se clasifica en una de varias categorías para que los moderadores humanos lo identifiquen fácilmente y tomen las medidas adecuadas.
Amazon Transcribe Call Analytics
Extraiga información de las conversaciones, como el sentimiento de las llamadas y el volumen de la voz, para mejorar la productividad de los agentes y la experiencia del cliente con Amazon Transcribe Call Analytics.
Mejore la productividad en los centros de contacto con la creación de resúmenes de llamadas basada en IA generativa
Genere resúmenes de llamadas automáticamente para ayudar a los agentes a centrarse en ofrecer excelentes experiencias a los clientes y aumentar la productividad al reducir la creación de resúmenes manual después de la llamada. Esta capacidad resume la interacción con la persona que llama y captura los componentes clave, como el motivo de la llamada, las medidas adoptadas para resolver el problema y los pasos siguientes. Los supervisores del centro de contacto pueden revisar los resúmenes de las llamadas para comprender rápidamente el contexto de una interacción sin tener que leer toda la transcripción mientras investigan los problemas de la persona que llama.
Extraiga análisis detallados de las llamadas e información sobre las conversaciones
Gracias a las posibilidades que ofrece el machine learning, podrá aplicar rápidamente las capacidades de conversión de voz a texto y procesamiento de lenguaje natural (NLP) durante las llamadas en directo y obtener información valiosa de la conversación. Así podrá integrar en las aplicaciones de análisis de llamadas entrantes y salientes datos, como la opinión de los clientes y los agentes, los problemas detectados y las características de la conversación, como el tiempo sin hablar, las interrupciones y la velocidad de conversación. Esto puede ayudar a los supervisores a identificar más fácilmente posibles problemas que tengan los clientes, oportunidades de formación para los agentes y tendencias de las llamadas.
Mejore el cumplimiento y la supervisión gracias a la categorización automatizada de las llamadas
Supervise las llamadas a escala para realizar un seguimiento del cumplimiento de las políticas de la empresa o de los requisitos regulatorios. Cree y entrene categorías personalizadas propias en función de criterios que especifique (como palabras/frases o características de la conversación). Por ejemplo, puede establecer etiquetas de categoría para ver qué porcentaje de llamadas corresponden a ventas adicionales o a cancelación de cuentas.
Produzca transcripciones de llamadas completas
Proporcione a sus agentes acceso a los detalles de las conversaciones de interacciones anteriores. Las transcripciones paso a paso proporcionan información como la opinión de los clientes, los problemas detectados y las interrupciones.
Proteja los datos confidenciales de los clientes
Las conversaciones con frecuencia contienen datos confidenciales de los clientes, como nombres, direcciones, números de tarjetas de crédito y números de la seguridad social. Transcribe Call Analytics ayuda a los clientes a identificar y redactar esta información a partir tanto del audio como del texto.
Integraciones del centro de contacto
Genesys Cloud CX
Genesys Cloud CX es una solución de centro de contacto en la nube que unifica las experiencias de los clientes y agentes a través de múltiples canales, como teléfono, mensajes de texto y chat. Puede transmitir el audio de su llamada a Amazon Transcribe desde el entorno de Genesys Cloud para mejorar la productividad de los agentes y extraer información sobre la interacción con los clientes. Consulte Integración de Genesys Cloud AudioHook para obtener más información. Además, comience a analizar sus llamadas de Genesys Cloud con la solución AWS Live Call Analytics.
SDK de Amazon Chime
El SDK de Amazon Chime es un conjunto de componentes de comunicaciones en tiempo real que los desarrolladores pueden utilizar para agregar con rapidez llamadas de audio, videollamadas y funciones de pantalla compartida a sus propias aplicaciones de telefonía, web o móviles.
Amazon Chime Voice Connector
El conector de voz de Amazon Chime le permite integrarse fácilmente con centros de contacto basados en SIP para generar transcripciones en tiempo real atribuidas por los usuarios con Amazon Transcribe. Consulte la documentación de Amazon Chime Voice Connector para obtener más información.
Amazon Transcribe Medical
Especialidades médicas
Transcriba fácilmente sus conversaciones médicas con Transcribe Medical, un servicio de reconocimiento automático de voz (ASR) que cumple con los requisitos de la HIPAA.
Modo de dictado
Transcriba con precisión el audio de un solo altavoz que se encuentra comúnmente en los casos de uso de dictados médicos. Más información »
Modo conversacional
Transcriba con precisión el audio conversacional de varios altavoces compuesto por médicos o pacientes por igual. Más información »
Transcriba voz a texto en una amplia gama de especialidades médicas. Más información »
API para lotes
Transcriba archivos de audio médicos grabados a escala con alta simultaneidad. Más información »
API de streaming
Transcriba transmisiones de audio casi en tiempo real mediante los protocolos WebSocket Secure o HTTP/2. Más información »
Vocabulario personalizado
Aumente la precisión de la transcripción mediante el uso de vocabulario personalizado para terminología que podría estar fuera del léxico. Más información »
Identificación de canales
Transcriba audio multicanal de forma simultánea sin costo adicional. Obtenga una transcripción final coherente. Más información »
Diarización de altavoces
Separe la voz de los distintos altavoces dentro de cualquier audio monocanal. Más información »
Visite la página de precios de Amazon Transcribe.
Obtenga acceso instantáneo a la capa gratuita de AWS.
Comience a crear con Amazon Transcribe en la consola de administración de AWS.