Publicado en: Jul 17, 2018

Amazon Transcribe es un servicio de reconocimiento de discurso automático (ASR) que le permite agregar capacidades de voz a texto a sus aplicaciones con facilidad. Puede utilizar Amazon Transcribe para crear transcripciones de texto de archivos de audio o video. Próximamente, Amazon Transcribe admitirá una característica llamada síntesis de canales a fin de gestionar mejor archivos de audio donde cada orador se graba en un canal independiente. Por ejemplo, una pista estéreo con el entrevistador grabado en el canal izquierdo y el entrevistado en el canal derecho.

Los centros de contacto se beneficiarán notablemente de esta característica de síntesis de canales cuando realicen transcripciones de grabaciones de llamadas de clientes multicanal. Normalmente, el agente y la persona que llama se graban en canales diferentes y se fusionan en un único archivo de audio. Por ejemplo, las aplicaciones de centros de contacto, como Amazon Connect, almacenan el canal de audio estéreo de los agentes y los clientes por separado. El audio del agente se almacena en el canal derecho. Todo el audio entrante, como el que corresponde al cliente final, se almacena en el canal izquierdo. Los centros de contacto pueden enviar el archivo de audio único a Amazon Transcribe, el cual identificará los dos canales, los separará, realizará las transcripciones de cada orador según el canal y, a continuación, generará una transcripción fusionada coherente con etiquetas de canal. Mediante las etiquetas de canal, los centros de atención ahora pueden identificar y analizar lo que dice cada orador con mayor precisión y eficiencia. Además, los clientes ya no necesitan enviar la grabación de cada canal como archivos de audio independientes para su transcripción, con lo cual se reduce tanto el costo global como la carga de trabajo para los centros de atención.