Publicado: Aug 11, 2021
O Amazon Chime SDK permite que os desenvolvedores adicionem compartilhamento de áudio, vídeo e tela em tempo real às aplicações móveis ou Web. A partir de hoje, os desenvolvedores podem sobrepor legendas, criar uma transcrição ou realizar análise de conteúdo em tempo real com transcrição de áudio ao vivo fornecida pelo Amazon Transcribe ou pelo Amazon Transcribe Medical.
Para criar transcrições de reuniões em tempo real sem que o áudio saia da rede AWS, o Amazon Chime SDK agora inclui uma integração do lado do serviço para sua conta do Amazon Transcribe. Para maior precisão em cenários de conversa dupla, o áudio dos usuários é processado separadamente, antes de ser mixado na reunião. O Amazon Chime usa seu algoritmo de locutor ativo para selecionar os dois principais locutores ativos e envia seu áudio para o Amazon Transcribe, em canais separados, por meio de uma única transmissão. Para reduzir a latência, as transcrições atribuídas pelo usuário são enviadas diretamente para cada participante da reunião por meio de mensagens de dados. Ao usar um pipeline de mídia para capturar o áudio da reunião, as informações de transcrição da reunião também são capturadas.
Os desenvolvedores podem acessar todos os idiomas de transmissão com suporte do Amazon Transcribe, bem como recursos como vocabulários personalizados e filtros de vocabulário. Ao usar o Amazon Transcribe Medical, os desenvolvedores podem escolher a especialidade, o tipo de conversa e, opcionalmente, fornecer qualquer vocabulário personalizado. Aplicam-se os custos padrão do Amazon Transcribe e Amazon Transcribe.
Para saber mais sobre o Amazon Chime SDK e a transcrição ao vivo com o Amazon Transcribe ou o Amazon Transcribe Medical, analise os seguintes recursos: