O Amazon Transcribe é um serviço de Automatic Speech Recognition (ASR – Reconhecimento automático de fala) que facilita para os desenvolvedores a adição de recursos de conversão de texto em fala aos seus aplicativos. Usando a API do Amazon Transcribe, você pode analisar arquivos de áudio armazenados no Amazon S3 e obter um arquivo de texto com a transcrição da fala. Você também pode enviar um stream de áudio ao vivo ao Amazon Transcribe e receber um stream de transcrições em tempo real.
O Amazon Transcribe pode ser usado para muitas aplicações comuns, incluindo a transcrição de chamadas de atendimento ao cliente e a geração de legendas em conteúdo de áudio e vídeo. O serviço pode transcrever arquivos de áudio armazenados em formatos comuns, como WAV e MP3, incluindo time stamps para cada palavra, o que permite localizar facilmente o áudio no conteúdo original pesquisando pelo texto. O Amazon Transcribe aprende e melhora continuamente para acompanhar a evolução da linguagem.
Principais recursos
Transcrições fáceis de ler
A maioria dos sistemas de reconhecimento de fala gera uma string de texto sem pontuação. O Amazon Transcribe usa aprendizado profundo para adicionar automaticamente pontuação e formatação. Dessa forma, a saída fica mais compreensível e pode ser usada sem edição adicional.
Geração de time stamps
O Amazon Transcribe retorna um time stamp para cada palavra, o que permite localizar facilmente o áudio na gravação original pesquisando pelo texto.
Suporte a uma grande variedade de casos de uso
O Amazon Transcribe foi projetado para disponibilizar transcrições precisas e automatizadas para uma grande variedade de níveis de qualidade de áudio. Você pode gerar legendas para qualquer vídeo o arquivo de áudio, e até mesmo transcrever gravações telefônicas de baixa qualidade, como chamadas para o atendimento ao cliente.
Vocabulário personalizado
O Amazon Transcribe permite ampliar e personalizar o vocabulário de reconhecimento de fala. Você pode adicionar novas palavras ao vocabulário básico e gerar transcrições altamente precisas e específicas para um caso de uso, como nomes de produtos, terminologia específica de domínios ou nomes de indivíduos.
Reconheça vários falantes
O Amazon Transcribe é capaz de reconhecer quando a pessoa que fala muda e atribui corretamente o texto transcrito. Esse recurso pode reduzir consideravelmente a quantidade de trabalho necessária para transcrever áudio com várias pessoas falando, como chamadas telefônicas, reuniões e shows de televisão.
Identificação de canal
O Amazon Transcribe é capaz de processar áudio e vídeo em que cada falante é gravado em diferentes canais. As centrais de contato podem se beneficiar substancialmente, enviando para o Amazon Transcribe um único arquivo de áudio que identificará cada canal e gerará uma única transcrição, anotada com os rótulos dos canais.
Transcrição de streaming
Com o Amazon Transcribe, você pode transcrever áudio para texto em tempo real. Usando uma conexão segura no protocolo HTTP 2, você pode enviar um stream de áudio ao vivo para o serviço e, em troca, receber um stream de texto em tempo real.
Casos de uso
O Amazon Transcribe pode oferecer transcrição para uma grande variedade de casos de uso, incluindo atendimento ao cliente, legendas, pesquisas e conformidade.
Melhoria do atendimento ao cliente
A conversão de entrada de áudio em texto pelo Amazon Transcribe permite criar aplicativos de análise de texto que podem pesquisar e analisar entradas de voz. As centrais de atendimento ao cliente podem usar o Amazon Transcribe para transcrever interações por voz e analisar os dados para obter insights usando outros serviços da AWS, como o Amazon Comprehend, para extrair significado e intenção das conversas.
Fluxos de trabalho de legendas e legendas ocultas
O Amazon Transcribe pode ajudar distribuidores de geração de conteúdo e mídia a aprimorar o alcance e o acesso por meio da geração automática de legendas com time stamps que podem ser exibidas juntamente com o conteúdo de vídeo.
Catalogação de arquivos de áudio
O serviço permite transcrever ativos de áudio e vídeo em arquivos completamente pesquisáveis para fins de monitoramento de conformidade e gerenciamento de riscos. Os clientes podem usar o Amazon Transcribe para converter áudio em texto e usar o Amazon Elasticsearch Service para indexar e executar pesquisas baseadas em texto em bibliotecas de áudio/vídeo.
Clientes do Amazon Transcribe
Saiba mais sobre a definição de preço do Amazon Transcribe