Amazon Transcribe

Reconhecimento automático de fala

O Amazon Transcribe é um serviço de Automatic Speech Recognition (ASR – Reconhecimento automático de fala) que permite que os desenvolvedores adicionem facilmente aos aplicativos recursos de conversão de fala em texto. Usando a API do Amazon Transcribe, você pode analisar arquivos de áudio armazenados no Amazon S3 e obter um arquivo de texto com a transcrição da fala.

O Amazon Transcribe pode ser usado para muitas aplicações comuns, incluindo a transcrição de chamadas de atendimento ao cliente e a geração de legendas em conteúdo de áudio e vídeo. O serviço pode transcrever arquivos de áudio armazenados em formatos comuns, como WAV e MP3, incluindo time stamps para cada palavra para que você possa localizar facilmente o áudio no conteúdo de origem pesquisando pelo texto. O Amazon Transcribe aprende e melhora continuamente para acompanhar a evolução da linguagem.

O AWS re:Invent 2017 apresenta o Amazon Transcribe

Principais recursos

Transcrições fáceis de ler

A maioria dos sistemas de reconhecimento de fala gera uma string de texto sem pontuação. O Amazon Transcribe usa aprendizado profundo para adicionar automaticamente pontuação e formatação. Dessa forma, a saída fica mais fácil para o leitor e pode ser usada sem edição adicional.

Suporte a áudio de telefonia

Normalmente, o áudio gravado de conversas por telefone tem baixa qualidade. O Amazon Transcribe foi projetado especificamente para oferecer alta precisão ao trabalhar com áudio de qualidade de telefonia, o que permite casos de uso como a transcrição de chamadas de atendimento ao cliente.  

Vários idiomas

O Amazon Transcribe pode transcrever automaticamente falas em inglês americano e espanhol. O suporte a mais idiomas será disponibilizado em breve.    

 

API simples de usar

A API do Amazon Transcribe facilita a conversão de fala em texto. Você não precisa de programação complexa. Basta chamar a API com algumas linhas de código e o Transcribe retornará o texto do arquivo de áudio armazenado no Amazon S3.

Suporte a vocabulários personalizados (disponível em breve)

O Amazon Transcribe permite ampliar e personalizar o vocabulário de reconhecimento de fala. Você pode adicionar novas palavras (juntamente com suas pronúncias) ao vocabulário básico e gerar transcrições altamente precisas e específicas para o caso de uso, mesmo quando a fala incluir terminologia ou gíria especializada ou nomes de produto exclusivos. Esse recurso ajuda a economizar tempo e edições adicionais, eliminando a necessidade de correções posteriores.

Geração de time stamps

O Amazon Transcribe retorna um time stamp para cada palavra para que você possa localizar facilmente o áudio no conteúdo de origem pesquisando pelo texto.

 

Reconheça várias pessoas falando (disponível em breve)

O Amazon Transcribe é capaz de reconhecer quando a pessoa que fala muda. O texto transcrito é atribuído corretamente. Esse recurso pode reduzir consideravelmente a quantidade de trabalho necessária para transcrever áudio com várias pessoas falando, como chamadas telefônicas, entrevistas e shows de televisão.

Casos de uso

O Amazon Transcribe pode oferecer transcrição para uma grande variedade de casos de uso, incluindo atendimento ao cliente, legendas, pesquisas e conformidade.

Melhoria do atendimento ao cliente

A conversão de entrada de áudio em texto pelo Amazon Transcribe permite criar aplicativos de análise de texto que podem pesquisar e analisar entradas de voz. As centrais de atendimento ao cliente podem usar o Amazon Transcribe para transcrever interações por voz e analisar os dados para obter insights usando outros serviços da AWS, como o Amazon Comprehend, para extrair significado e intenção das conversas.

Fluxos de trabalho de legendas e legendas ocultas

O Amazon Transcribe pode ajudar distribuidores de geração de conteúdo e mídia a aprimorar o alcance e o acesso por meio da geração automática de legendas com time stamps que podem ser exibidas juntamente com o conteúdo de vídeo.

Catalogação de arquivos de áudio

O serviço permite transcrever ativos de áudio e vídeo em arquivos completamente pesquisáveis para fins de monitoramento de conformidade e gerenciamento de riscos. Os clientes podem usar o Amazon Transcribe para converter áudio em texto e usar o Amazon ElasticSearch para indexar e executar pesquisas baseadas em texto em bibliotecas de áudio/vídeo.

Referências de clientes

O RingDNA é um mecanismo de aceleração de vendas empresariais e uma plataforma de comunicação por voz. As equipes de vendas internas usam o RingDNA para aumentar consideravelmente a produtividade, participar de conversas de vendas mais inteligentes, obter insights de vendas preditivas e treinar representantes para o sucesso com muito mais rapidez do que antes. 

“O RingDNA é uma plataforma completa de comunicações para equipes de vendas. Centenas de organizações empresariais usam o RingDNA para aumentar consideravelmente a produtividade, participar de conversas de vendas mais inteligentes, obter insights de vendas preditivas, melhorar a taxa de ganho e treinar representantes para o sucesso com muito mais rapidez do que antes. Um componente essencial da IA de conversação do RingDNA exige conversão de fala em texto de altíssima qualidade para fornecer transcrições de todas as chamadas telefônicas. A RingDNA está entusiasmada com o Amazon Transcribe, pois o serviço oferece reconhecimento de fala de alta qualidade em grande escala, o que nos ajuda a transcrever melhor todas as chamadas para texto.”

Howard Brown, diretor executivo e fundador, RingDNA

A Isentia, sediada em Sydney, Austrália, é uma líder no fornecimento de inteligência de mídia na região Ásia-Pacífico. A empresa opera em 18 escritórios em toda a região e oferece suporte a mais de 5.000 clientes em todo o mundo, incluindo 84 das 100 principais marcas globais. Os produtos da Isentia ajudam os clientes a tomar decisões comerciais e de comunicação de maneira mais informada e ágil.

“Na Isentia, capacitamos os clientes a analisar e monitorar a cobertura de imprensa para suas marcas. Criamos mais de 13 mil resumos por dia com base em conteúdo de rádio e TV. Com o Amazon Transcribe, podemos transcrever todo o conteúdo de áudio/vídeo que monitoramos e analisar os dados do texto com o Amazon Clair. Recursos como time stamps e pontuação facilitam muito a pesquisa e o detalhamento de dados, além de oferecer insights importantes para a análise dos clientes.”

Andrea Walsh, diretora de tecnologia da informação, Isentia

Saiba mais sobre a definição de preço do Amazon Transcribe

Acesse a página de definição de preço