Publicado: Jul 17, 2018
O Amazon Transcribe é um serviço de Automatic Speech Recognition (ASR – Reconhecimento automático de fala) que facilita a adição de recursos de conversão de texto em fala aos aplicativos. Você pode usar o Amazon Transcribe para criar transcrições de texto de arquivos de áudio e vídeo. Em breve, o Amazon Transcribe oferecerá suporte para um recurso chamado síntese de canal para lidar melhor com o áudio, onde cada locutor registra em um canal diferente. Por exemplo, uma faixa estéreo com o entrevistador é armazenada à esquerda e o entrevistado à direita.
As centrais de contato podem se beneficiar significativamente ao usar o recurso de síntese de canais, pois fazem transcrições de gravações de chamadas de clientes em vários canais. Normalmente, um agente e um chamador são gravados em canais separados e mesclados em um único arquivo de áudio. Por exemplo, aplicativos de contact center, como o Amazon Connect, armazenam os canais de áudio estéreo dos agentes e dos clientes separadamente. O áudio do agente será armazenado no canal pertinente. Todo o áudio recebido, como o cliente final, é armazenado no canal esquerdo. Os contact centers podem enviar o único arquivo de áudio para o Amazon Transcribe, que identificará os dois canais, os dividirá, fará transcrições de cada locutor por canal e produzirá uma transcrição coerente com rótulos de canal. Usando os rótulos dos canais, os contact centers agora podem identificar e analisar melhor o que cada locutor diz com maior precisão e eficiência. Além disso, os clientes não precisam mais enviar as gravações de cada canal como arquivos de áudio individuais para transcrição, reduzindo assim o custo geral e a carga de trabalho das centrais de contato.