Publicado en: Oct 20, 2021
Nos complace anunciar que Amazon Transcribe ahora soportará los modelos de lenguaje personalizados (CLM) para la transcripción en streaming. Amazon Transcribe es un servicio de automatic speech recognition (ASR, reconocimiento de voz automático) que permite agregar con facilidad capacidades de conversión de voz en texto a sus aplicaciones. Un CLM permite utilizar datos preexistentes para crear un motor de voz personalizado destinado a casos de uso de transcripción. No se necesita experiencia previa en machine learning.
La transcripción en streaming se utiliza en todos los sectores en aplicaciones de centros de contacto, eventos de difusión y aprendizaje electrónico. El Custom Language Models (CLM, modelos de lenguaje personalizados) lo habilita para mejorar la precisión de la transcripción al aprovechar los datos de texto, como el contenido del sitio web o los manuales de instrucciones, que abarcan el léxico y el vocabulario exclusivos de su industria. Para comenzar, solo cargue el conjunto de datos de formación para entrenar el CLM. A continuación, ejecute los trabajos de transcripción con el nuevo CLM.
CLM para transcripciones en streaming está disponible en inglés americano y en las regiones de AWS donde se admite Amazon Transcribe streaming, incluidos EE. UU. Este (Norte de Virginia), EE. UU. Este (Ohio), EE. UU. Oeste (Oregón), Sudamérica (São Paulo), Asia-Pacífico (Seúl), Asia-Pacífico (Sídney), Asia-Pacífico (Tokio), Canadá (Central), EU (Fráncfort), EU (Irlanda) y EU (Londres). Para obtener más detalles acerca de la característica de CLM, lea nuestra publicación en el blog “Creación de modelos de lenguaje personalizados para optimizar el rendimiento de la conversión de voz en texto de Amazon Transcribe” o visite la página de documentación de Amazon Transcribe.