Publicado en: Dec 7, 2022

Hoy nos complace anunciar que los modelos de idiomas personalizados (CLM) de Amazon Transcribe ahora admiten los idiomas alemán y japonés en modo de streaming y por lotes. Amazon Transcribe es un servicio de automatic speech recognition (ASR, reconocimiento de voz automático) que permite añadir con facilidad capacidades de conversión de voz a texto en las aplicaciones. Un CLM permite utilizar datos preexistentes para crear un motor de voz personalizado destinado a casos de uso específicos de transcripción por lotes y en streaming. No se requiere experiencia previa en machine learning para crear un CLM.

El CLM utiliza los datos de texto que el usuario ya posee, tales como contenido de sitios web, manuales de instrucciones y otros activos que cubran el léxico y el vocabulario únicos de su dominio. Cargue el conjunto de datos de entrenamiento para crear un CLM y ejecutar trabajos de transcripción con el nuevo CLM. El CLM de Amazon Transcribe está destinados a los clientes que operan en dominios tan diversos como son el derecho, las finanzas, la hostelería, los seguros y los medios de comunicación. Los CLM están diseñados para mejorar la precisión de la transcripción de voz de un dominio específico. Esto incluye todo contenido que no sea lo que se escucharía en conversaciones normales y cotidianas. Por ejemplo, si transcribe las actas de una conferencia científica, es poco probable que una transcripción estándar reconozca muchos de los términos científicos utilizados por los presentadores. Con el CLM de Amazon Transcribe, puede entrenar un modelo de idioma personalizado para reconocer los términos especializados que se utilizan en su disciplina.

El CLM ahora admite el idioma alemán y el japonés para las transcripciones por lotes y en streaming, y está disponible en todas las regiones de AWS en las que opera Amazon Transcribe. Para comenzar a crear un modelo propio de reconocimiento de voz personalizado, inicie sesión en la consola de servicio de Amazon Transcribe. Para obtener más detalles acerca de la característica de CLM, consulte la publicación “Creación de modelos de idiomas personalizados para optimizar el rendimiento de la conversión de voz a texto de Amazon Transcribe”. Para obtener más información, consulte la página de documentación de Amazon Transcribe.