Publicado: Dec 7, 2022

Hoje, temos o prazer de anunciar que os modelos de idiomas personalizados (CLM) do Amazon Transcribe agora oferecem suporte aos idiomas alemão e japonês nos modos em lote e de streaming. O Amazon Transcribe é um serviço de reconhecimento automático de fala (ASR) que facilita a adição de recursos de conversão de fala em texto às suas aplicações. O CLM permite que você use dados pré-existentes para criar um mecanismo de fala personalizado para os seus casos de uso específicos de transcrição em lote e de streaming. Nenhuma experiência prévia de machine learning é necessária para criar seu CLM.

O CLM usa dados de texto que você já possui, como conteúdo de site, manuais de instruções e outros ativos que abrangem o léxico e o vocabulário exclusivos do seu domínio. Carregue seu conjunto de dados de treinamento para criar um CLM e executar trabalhos de transcrição usando seu novo CLM. O CLM do Amazon Transcribe foi feito para clientes que operam em domínios diversificados, como direito, finanças, hospitalidade, seguros e mídia. Os CLMs são projetados para melhorar a precisão da transcrição da fala específica do domínio. Isso inclui qualquer conteúdo diferente do que você ouviria em conversas normais do dia a dia. Por exemplo, se você estiver transcrevendo os autos de uma conferência científica, será improvável que uma transcrição padrão reconheça muitos dos termos científicos usados pelos apresentadores. Usando o CLM do Amazon Transcribe, você pode treinar um modelo de linguagem personalizado para reconhecer os termos especializados usados em sua disciplina.

O CLM agora oferece permite alemão e japonês para transcrições em lote e de streaming e está disponível em todas as regiões da AWS nas quais o Amazon Transcribe opera. Para começar a criar seu próprio modelo de reconhecimento de voz personalizado, faça login no console de serviço do Amazon Transcribe. Para obter mais detalhes sobre o recurso CLM, consulte a publicação “Building custom language models to supercharge speech-to-text performance for Amazon Transcribe”. Você pode saber mais consultando a página de documentação do Amazon Transcribe.