Créer une transcription audio
avec Amazon Transcribe
Dans ce didacticiel détaillé, vous allez apprendre à utiliser Amazon Transcribe pour créer la transcription textuelle d’un fichier audio enregistré en utilisant AWS Management Console. Amazon Transcribe est un service de reconnaissance vocale automatique qui permet aux développeurs d'ajouter facilement une fonction de reconnaissance vocale à leurs applications. Avec l'API Amazon Transcribe, vous pouvez analyser des fichiers audio stockés dans Amazon Simple Storage Service (S3) et demander au service de vous renvoyer un fichier texte de la parole transcrite.
En tant que développeur, la création de transcriptions d'appels au service clientèle ou la génération de sous-titres dans du contenu audio et vidéo sont des défis courants nécessitant des capacités de reconnaissance vocale. Ce défi pourrait être relevé en créant vos propres modèles de machine learning à de zéro. Toutefois, cette option est longue et coûteuse, et nécessite une expertise en matière de machine learning. Au lieu d’emprunter la voie difficile, vous pouvez utiliser Amazon Transcribe, un service préformé et entièrement géré, qui fournit des transcriptions rapides et de haute qualité.
Dans ce didacticiel, vous allez télécharger un exemple de fichier audio, puis le charger dans un compartiment S3 que vous créerez. Ensuite, vous utiliserez Amazon Transcribe pour créer une transcription de l’exemple de clip audio en utilisant AWS Management Console.
Ce tutoriel est une démonstration des fonctionnalités disponibles lors de l'utilisation de la CLI AWS ou de l’API Transcribe. Pour la production ou les mises en œuvre de preuves de concept, nous recommandons d'utiliser ces interfaces programmatiques plutôt qu’Amazon Transcribe Console.
Ce didacticiel nécessite de disposer d’un compte AWS.
Le démarrage avec l'offre gratuite Amazon Transcribe est simple. Transcrivez jusqu'à 60 minutes d'audio chaque mois, et gratuitement pendant les 12 premiers mois à partir de l’ouverture de votre compte AWS.
Étape 1. Créer un compartiment S3 et charger un exemple de fichier audio
Dans cette étape, vous allez télécharger un exemple de fichier audio, créer un compartiment S3, puis charger l’exemple de fichier vers le compartiment S3. Transcrire accède aux fichiers audio et vidéo pour la transcription exclusivement à partir des compartiments S3.
a. Lorsque vous cliquez ici, vous téléchargez l’exemple de fichier audio pour le transcrire plus tard dans le didacticiel. Le fichier s’appelle transcribe-sample.mp3.
b. Lorsque vous cliquez ici, AWS Management Console s’ouvre dans une nouvelle fenêtre de navigateur afin de maintenir ce guide détaillé ouvert. Lorsque cet écran se charge, saisissez votre nom d'utilisateur et votre mot de passe pour commencer. Dans la liste déroulante Région, sélectionnez une région disposant d'Amazon Transcribe.
Au moment de la rédaction de ce document, Amazon Transcribe est disponible dans les régions suivantes : USA Est (Virginie du Nord), USA Est (Ohio), USA Ouest (Oregon), Asie-Pacifique (Sydney), Canada (Centre) et UE (Irlande).
d. Dans le tableau de bord S3, choisissez Créer un compartiment.
Si c'est la première fois que vous créez un compartiment, un écran similaire à celui représenté ici s’affiche.
Si vous avez déjà créé des compartiments S3, votre tableau de bord S3 répertorie tous les compartiments que vous avez créés.
e. Saisissez un nom de compartiment unique. Les noms de compartiments doivent être uniques parmi tous les noms de compartiments existants dans Amazon S3. Plusieurs restrictions s'appliquent aux noms de compartiment S3 également. Sélectionnez ensuite une région où créer votre compartiment.
Sélectionnez Suivant.
f. Vous disposez d’un grand nombre d’options pratiques pour votre compartiment S3 : Gestion des versions, Journalisation de l’accès au serveur, Balises, journalisation au niveau des objets et chiffrement par défaut. Nous n'allons pas activer ces fonctions pour ce didacticiel.
Sélectionnez Suivant.
Étape 2. Créer une tâche de transcription
Dans cette étape, vous allez créer et exécuter une tâche de transcription en utilisant la console Amazon Transcribe.
d. Sur la page Créer une tâche de transcription, dans le champ Nom, saisissez exemple-de-tâche-de-transcription.
Comme Langue par défaut, laissez Anglais.
Dans le champ Emplacement du fichier d'entrée sur S3, collez le lien d'accès à l'exemple de fichier dans votre compartiment S3. Le lien d'accès à votre exemple de fichier est différent de celui indiqué sur la capture d'écran à droite.
Comme Format par défaut, laissez mp3.
Vous pouvez utiliser la fonction Vocabulaire personnalisé pour aider Amazon Translate à reconnaître les mots et les phrases de votre application, comme le nom non anglophone Étienne. Vous n'utiliserez pas cette fonction dans le cadre de ce didacticiel.
e. Comme Emplacement des données par défaut, laissez Amazon (par défaut).
Si vous activez la fonction Identification de canaux, Amazon Transcribe peut traiter l'audio où chaque intervenant est enregistré sur différents canaux, et produire une seule transcription annotée par les étiquettes des canaux.
Si vous activez la fonction Identification des interlocuteurs, Amazon Transcribe reconnaît les changements de l'intervenant et attribue le texte transcrit de manière appropriée.
Aucune de ces options n'est utilisée dans le cadre de ce didacticiel.
Sélectionnez Créer pour lancer votre tâche de transcription.
Étape 3. Vérifier les résultats de la transcription
Dans cette étape, vous allez apprendre à vérifier l'avancement et à examiner les résultats de votre tâche de transcription.
a. Après avoir cliqué sur le bouton Créer, vous accédez à l’écran Tâches de transcription. Il indique le statut de exemple-de-tâche-de-transcription. Le statut peut être En cours, Terminé ou Échec.
Lorsque le statut est Terminé, cliquez sur le lien exemple-de-tâche-de-transcription dans la colonne Nom pour afficher les résultats de la transcription.
b. Ensuite, les informations de exemple-de-tâche-de-transcription s’affichent. Faites défiler jusqu’au volet Transcription pour afficher la sortie de la tâche de transcription. Dans le volet JSON, vous pouvez voir les résultats de la transcription tels qu’ils seront retournés par l’API Transcribe ou la CLI AWS.
Étape 4. Résilier des ressources
Dans cette étape, vous allez supprimer l’exemple de fichier de votre compartiment S3 pour éviter des frais inutiles.
Félicitations !
Comme vous l'avez vu dans ce didacticiel, Amazon Transcribe permet de la convertir la voix en texte à grande échelle. Utilisez Amazon Transcribe pour un large éventail de fichiers audio ou vidéo, tels que les appels au service clientèle, les réunions d'affaires, les émissions de télévision et les vidéos à la demande.
Nous vous recommandons :
Apprendre à traduire à grande échelle
Découvrez comment traduire des textes transcrits dans une autre langue en utilisant Amazon Translate dans ce didacticiel de 10 minutes.
Démarrer avec l’API Transcribe ou la CLI
Découvrez comment utiliser l’API et la CLI Amazon Transcribe dans ce tutoriel dans la documentation.
Explorer Amazon Comprehend
Découvrez comment analyser les sentiments dans du texte en utilisant Amazon Comprehend dans ce didacticiel de 10 minutes.