Crie uma transcrição de áudio

com o Amazon Transcribe

Neste tutorial passo a passo, você aprenderá a usar o Amazon Transcribe para criar uma transcrição de texto de um arquivo de áudio gravado usando o Console de Gerenciamento da AWS. O Amazon Transcribe é um serviço de Automatic Speech Recognition (ASR – Reconhecimento automático de fala) que facilita para os desenvolvedores a adição de recursos de conversão de texto em fala aos seus aplicativos. Usando a API do Amazon Transcribe, você pode analisar arquivos de áudio armazenados no Amazon Simple Storage Service (S3) e fazer com que o serviço retorne um arquivo de texto da fala transcrita.

Como desenvolvedor, criar transcrições de chamadas de atendimento ao cliente ou gerar legendas em conteúdo de áudio e vídeo são desafios comuns que exigem recursos de comversão de fala em texto. Você pode resolver esse desafio criando seus próprios modelos de machine learning do zero. No entanto, essa opção é demorada, cara e requer conhecimentos de machine learning. Em vez de seguir o caminho difícil, você pode usar o Amazon Transcribe, um serviço pré-treinado e totalmente gerenciado, que fornece transcrições rápidas e de alta qualidade.

Neste tutorial, você fará download de um arquivo de áudio de amostra e depois fará upload em um bucket do S3 que você criará. Em seguida, você usará o Amazon Transcribe para criar uma transcrição com base no exemplo de clipe de áudio usando o Console de Gerenciamento da AWS.

Este tutorial é uma demonstração da funcionalidade disponível usando a CLI da AWS ou a API do Transcribe. Para implementações de produção ou prova de conceito, recomendamos o uso dessas interfaces programáticas em vez do Console do Amazon Transcribe.

Este tutorial exige uma conta da AWS

É fácil começar com o nível gratuito do Amazon Transcribe. Transcreva até 60 minutos de áudio por mês, grátis nos primeiros 12 meses após a abertura da sua conta da AWS.

Saiba mais sobre o nível gratuito >>


Etapa 1. Criar um bucket do S3 e fazer upload de um exemplo de arquivo de áudio

Nesta etapa, você fará download de um arquivo de áudio de amostra, criará um bucket do S3 e fará upload desse arquivo de amostra no bucket do S3. O Transcribe acessa arquivos de áudio e vídeo para transcrição exclusivamente de buckets do S3.


a.  Quando você clicar aqui, baixará o arquivo de áudio de amostra para transcrever mais tarde no tutorial. O nome do arquivo é transcribe-sample.mp3.


b.  Ao clicar aqui, o Console de Gerenciamento da AWS será aberto em uma nova janela do navegador, para que você possa manter este guia passo a passo aberto. Quando a tela carregar, digite seu nome do usuário e senha para começar. Usando o menu suspenso Região, selecione uma região que tenha o Amazon Transcribe.

Até o momento, o Amazon Transcribe está disponível nas regiões Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Ásia-Pacífico (Sydney), Canadá (Central) e UE (Irlanda).

create-audio-transcript-transcribe-step-1b
create-audio-transcript-transcribe-step-1b

(clique para aumentar)


c. Digite S3 na barra de pesquisa e selecione S3 para abrir o console.

create-audio-transcript-transcribe-step-1c
create-audio-transcript-transcribe-step-1c

(clique para aumentar)


d.  No painel do S3, clique em Criar bucket.

Se esta for a primeira vez que você cria um bucket, verá uma tela semelhante à esta imagem.

Se você já criou buckets do S3, o painel do S3 listará todos os buckets criados.

create-audio-transcript-transcribe-step-1d
create-audio-transcript-transcribe-step-1d

(clique para aumentar)


e.  Insira um nome de bucket exclusivo. Os nomes de bucket devem ser únicos entre todos os nomes de buckets existentes no Amazon S3. Há também uma série de outras restrições sobre os nomes de buckets do S3. Em seguida, selecione uma região na qual criar seu bucket.

Selecione Next.

create-audio-transcript-transcribe-step-1e
create-audio-transcript-transcribe-step-1e

(clique para aumentar)


f.  Você tem muitas opções úteis para o seu bucket do S3, incluindo Versionamento, Registro em acesso do acesso ao servidor, Tags, Registro em log em nível de objeto e Criptografia padrão. Não habilitaremos esses recursos neste tutorial.

Selecione Next.

create-audio-transcript-transcribe-step-1f
create-audio-transcript-transcribe-step-1f

(clique para aumentar)


g.  Nesta etapa, você terá a capacidade de ajustar as configurações de permissão para o bucket do S3 durante o processo de criação desse bucket.

Deixe os valores padrão e selecione Next.

create-audio-transcript-transcribe-step-1g
create-audio-transcript-transcribe-step-1g

(clique para aumentar)


h.  Revise suas definições de configuração e selecione Criar bucket.

create-audio-transcript-transcribe-step-1h
create-audio-transcript-transcribe-step-1h

(clique para aumentar)


i.  Você poderá ver o novo bucket no console do S3. Clique no nome do bucket para navegar até ele. O nome do seu bucket não será o mesmo que o mostrado na captura de tela à direita.

create-audio-transcript-transcribe-step-1i
create-audio-transcript-transcribe-step-1i

(clique para aumentar)


j. Você está na página inicial do bucket.

Selecione Fazer upload.

create-audio-transcript-transcribe-step-1j
create-audio-transcript-transcribe-step-1j

(clique para aumentar)


k.  Faça upload do arquivo transcribe-sample.mp3 selecionando Adicionar arquivos e escolhendo o arquivo OU arrastando o arquivo transcribe-sample.mp3 até a caixa de upload.

Selecione Fazer upload.

create-audio-transcript-transcribe-step-1k
create-audio-transcript-transcribe-step-1k

(clique para aumentar)


l.  Marque a caixa de seleção ao lado do arquivo transcribe-sample.mp3 no seu bucket. Um painel de detalhes do arquivo será exibido para o arquivo transcribe-sample.mp3. Copie o link para o arquivo e salve-o para uso mais adiante no tutorial.

create-audio-transcript-transcribe-step-1l
create-audio-transcript-transcribe-step-1l

(clique para aumentar)


Etapa 2. Criar um trabalho de transcrição

Nesta etapa, você criará e executará um trabalho de transcrição usando o console do Amazon Transcribe.


a.  Na barra de menus superior, selecione Serviços, comece a digitar Transcribe na barra de pesquisa e selecione Amazon Transcribe para abrir o console de serviço.

create-audio-transcript-transcribe-step-2a
create-audio-transcript-transcribe-step-2a

(clique para aumentar)


b.  Na página principal do console do Amazon Transcribe, abra o painel de navegação e clique emTrabalhos de transcrição.

c. Na página Trabalhos de transcrição, clique em Criar trabalho.

create-audio-transcript-transcribe-step-2b
create-audio-transcript-transcribe-step-2b

(clique para aumentar)


d.  Na página Criar trabalho de transcrição, no campo Nome, digite sample-transcription-job.

Deixe o Idioma padrão como Inglês.

No campo Inserir local do arquivo no S3, cole o link para o arquivo de amostra no seu bucket do S3. O link para o seu arquivo de amostra será diferente daquele mostrado à direita.  

Deixe o Formato padrão de mp3.

Você pode usar o recurso Vocabulário personalizado para ajudar o Amazon Translate a reconhecer palavras e frases específicas do seu aplicativo, como um nome em um idioma diferente do inglês, por exemplo, Etienne. Você não usará esse recurso neste tutorial.

create-audio-transcript-transcribe-step-2c
create-audio-transcript-transcribe-step-2c

(clique para aumentar)


e.  Deixe o Local de dados padrão como Padrão da Amazon.

Se você habilitar a Identificação de canal, o Amazon Transcribe será capaz de processar áudio em que cada orador é gravado em canais diferentes e produzir uma única transcrição anotada com rótulos de canal.

Se você ativar a Identificação do orador, o Amazon Transcribe reconhecerá quando o orador mudar e atribuirá o texto transcrito adequadamente.

Nenhuma dessas opções é usada neste tutorial.

Selecione Criar para iniciar o trabalho de transcrição.  

create-audio-transcript-transcribe-step-2d
create-audio-transcript-transcribe-step-2d

(clique para aumentar)


Etapa 3. Revisar resultados da transcrição

Nesta etapa, você aprenderá a verificar o progresso e a revisar os resultados do seu trabalho de transcrição.


a.  Depois de clicar no botão Criar, você acessará a tela Trabalhos de transcrição. Ele mostrará o status de sample-transcription-job. O status pode ser Em andamento, Concluído ou Com falha.

Quando o status for Completo, clique no link sample-transcription-job na coluna Nome para visualizar os resultados da transcrição.

create-audio-transcript-transcribe-step-3a
create-audio-transcript-transcribe-step-3a

(clique para aumentar)


b.   Em seguida, você verá os detalhes de sample-transcription-job. Role para baixo até o painel Transcrição para visualizar a saída do trabalho de transcrição. No painel JSON, é possível visualizar os resultados da transcrição que seriam retornados da API do Transcribe ou da CLI da AWS.

create-audio-transcript-transcribe-step-3b
create-audio-transcript-transcribe-step-3b

(clique para aumentar)


Etapa 4. Encerrar recursos

Nesta etapa, você excluirá o arquivo de amostra do seu bucket do S3 para evitar cobranças desnecessárias.


a.  Neste menu de navegação superior, clique em Serviços, comece a digitar S3 na barra de pesquisa e selecione S3 para abrir o console.

create-audio-transcript-transcribe-step-4a
create-audio-transcript-transcribe-step-4a

(clique para aumentar)


b.  Percorra os buckets do S3 e encontre o bucket que você criou anteriormente neste tutorial. Clique no nome deste bucket para visualizar seu conteúdo. O nome do seu bucket será diferente que o mostrado na captura de tela à direita.

create-audio-transcript-transcribe-step-4b
create-audio-transcript-transcribe-step-4b

(clique para aumentar)


c.  Selecione o arquivo transcribe-sample.mp3 contido no seu bucket e, no menu Ações, selecione Excluir . Confirme a exclusão.

create-audio-transcript-transcribe-step-4c
create-audio-transcript-transcribe-step-4c

(clique para aumentar)


Parabéns!

Como você viu neste tutorial, o Amazon Transcribe permite converter voz em texto em grande escala. Use o Amazon Transcribe para vários tipos de arquivos de áudio ou vídeo, como chamadas de atendimento ao cliente, reuniões de negócios, TV aberta e vídeos sob demanda.

 

Aprenda a traduzir texto em grande escala

Descubra como você pode traduzir textos transcritos para outro idioma usando o Amazon Translate neste tutorial de 10 minutos.

Introdução à API e a CLI do Transcribe

Aprenda a usar a API e a CLI do Amazon Transcribe neste tutorial na documentação.

Explorar o Amazon Comprehend

Aprenda a analisar sentimentos em texto usando o Amazon Comprehend neste tutorial de 10 minutos.

 


Este tutorial foi útil para você?