Publié le: Oct 20, 2021
Nous avons le plaisir d'annoncer qu'Amazon Transcribe prend désormais en charge les modèles de langue personnalisés (CLM, custom language model) pour la transcription de diffusions en continu. Amazon Transcribe est un service de reconnaissance vocale automatique (ASR) qui vous permet d'ajouter facilement des fonctionnalités de synthèse vocale à vos applications. Le CLM vous permet d'exploiter les données pré-existantes pour créer un moteur de reconnaissance vocale adapté à vos cas d'utilisation de transcription. Aucune expérience préalable en machine learning n'est requise.
La transcription de streaming en direct est utilisée dans de très nombreux secteurs dans les applications de centre de contact, les événements diffusés et la formation en ligne. Le CLM vous permet d'améliorer la précision des transcriptions en exploitant des données de textes, tels que le contenu de sites web ou les manuels d'instructions, comprenant des termes spécifiques à votre secteur. Pour commencer, téléchargez simplement votre jeu de données d'entraînement pour entraîner votre CLM. Exécutez ensuite simplement les tâches de transcription à l'aide votre nouveau CLM.
Le CLM pour les transcriptions de streaming est disponible en anglais américain et dans les régions AWS où le streaming Amazon Transcribe est pris en charge : USA Est (Virginie du Nord), USA Est (Ohio), USA Ouest (Oregon), Amérique du Sud (Sao Paulo), Asie-Pacifique (Séoul), Asie-Pacifique (Sydney), Asie-Pacifique (Tokyo), Canada (Centre), EU (Francfort), EU (Irlande) et EU (Londres). Pour plus de détails sur la fonction CLM, lisez notre article de blog « Building custom language models to supercharge speech-to-text performance for Amazon Transcribe » (Création de modèles de langue personnalisés pour tirer pleinement parti des performances de synthèse vocale d'Amazon Transcribe), ou la page de documentation d'Amazon Transcribe.