Publié le: Dec 7, 2022
Nous sommes ravis d'annoncer qu'à partir d'aujourd'hui, les modèles linguistiques personnalisés (CLM) d'Amazon Transcribe prennent en charge l'allemand et le japonais en modes lots et streaming. Amazon Transcribe est un service de reconnaissance vocale automatique (ASR) qui vous permet d'ajouter facilement des fonctionnalités de synthèse vocale à vos applications. Le CLM vous permet d'utiliser les données préexistantes pour créer un moteur de parole personnalisé pour vos cas d'utilisation spécifiques de transcription par lots et en streaming. La création de votre CLM ne nécessite aucune expérience préalable en machine learning.
Le CLM utilise les données textuelles déjà en votre possession, comme le contenu du site web, les manuels d'instruction et les autres ressources qui couvrent le lexique et la terminologie propres à votre domaine. Téléchargez votre jeu de données d'entraînement pour créer un CLM et exécuter des tâches de transcription à l'aide de ce dernier. Le CLM d'Amazon Transcribe est destiné aux clients qui opèrent dans des secteurs comme le droit, la finance, l'hôtellerie, l'assurance et le multimédia. Les CLM sont conçus pour améliorer la précision de la transcription des discours spécifiques à un domaine. Cela comprend tout contenu au-delà de ce que vous pourriez entendre dans des conversations normales du quotidien. Par exemple, si vous transcrivez le compte rendu d'une conférence scientifique, il est peu probable qu'une transcription standard reconnaisse la plupart des termes scientifiques utilisés par les intervenants. À l'aide du CLM d'Amazon Transcribe, vous pouvez entraîner un modèle de langue personnalisé à reconnaître les termes spécialisés utilisés dans votre discipline.
La nouvelle prise en charge de l'allemand et du japonais par les CLM pour les transcriptions par lots et en streaming est désormais disponible dans toutes les régions AWS qui disposent d'Amazon Transcribe. Pour commencer à créer votre propre modèle de reconnaissance vocale personnalisé, connectez-vous à la console du service Amazon Transcribe. Pour plus de détails sur les CLM, consultez l'article « Building custom language models to supercharge speech-to-text performance for Amazon Transcribe ». Pour en savoir plus, consultez la page de documentation d'Amazon Transcribe.