Créer une transcription audio

avec Amazon Transcribe

Dans ce didacticiel détaillé, vous allez apprendre à utiliser Amazon Transcribe pour créer la transcription textuelle d’un fichier audio enregistré en utilisant AWS Management Console. Amazon Transcribe est un service de reconnaissance vocale automatique qui permet aux développeurs d'ajouter facilement une fonction de reconnaissance vocale à leurs applications. Avec l'API Amazon Transcribe, vous pouvez analyser des fichiers audio stockés dans Amazon Simple Storage Service (S3) et demander au service de vous renvoyer un fichier texte de la parole transcrite.

En tant que développeur, la création de transcriptions d'appels au service clientèle ou la génération de sous-titres dans du contenu audio et vidéo sont des défis courants nécessitant des capacités de reconnaissance vocale. Ce défi pourrait être relevé en créant vos propres modèles de machine learning à de zéro. Toutefois, cette option est longue et coûteuse, et nécessite une expertise en matière de machine learning. Au lieu d’emprunter la voie difficile, vous pouvez utiliser Amazon Transcribe, un service préformé et entièrement géré, qui fournit des transcriptions rapides et de haute qualité.

Dans ce didacticiel, vous allez télécharger un exemple de fichier audio, puis le charger dans un compartiment S3 que vous créerez. Ensuite, vous utiliserez Amazon Transcribe pour créer une transcription de l’exemple de clip audio en utilisant AWS Management Console.

Ce tutoriel est une démonstration des fonctionnalités disponibles lors de l'utilisation de la CLI AWS ou de l’API Transcribe. Pour la production ou les mises en œuvre de preuves de concept, nous recommandons d'utiliser ces interfaces programmatiques plutôt qu’Amazon Transcribe Console.

Ce didacticiel nécessite de disposer d’un compte AWS.

Le démarrage avec l'offre gratuite Amazon Transcribe est simple. Transcrivez jusqu'à 60 minutes d'audio chaque mois, et gratuitement pendant les 12 premiers mois à partir de l’ouverture de votre compte AWS.

En savoir plus sur l’offre gratuite >>


Étape 1. Créer un compartiment S3 et charger un exemple de fichier audio

Dans cette étape, vous allez télécharger un exemple de fichier audio, créer un compartiment S3, puis charger l’exemple de fichier vers le compartiment S3. Transcrire accède aux fichiers audio et vidéo pour la transcription exclusivement à partir des compartiments S3.


a.  Lorsque vous cliquez ici, vous téléchargez l’exemple de fichier audio pour le transcrire plus tard dans le didacticiel. Le fichier s’appelle transcribe-sample.mp3.


b.  Lorsque vous cliquez ici, AWS Management Console s’ouvre dans une nouvelle fenêtre de navigateur afin de maintenir ce guide détaillé ouvert. Lorsque cet écran se charge, saisissez votre nom d'utilisateur et votre mot de passe pour commencer. Dans la liste déroulante Région, sélectionnez une région disposant d'Amazon Transcribe.

Au moment de la rédaction de ce document, Amazon Transcribe est disponible dans les régions suivantes : USA Est (Virginie du Nord), USA Est (Ohio), USA Ouest (Oregon), Asie-Pacifique (Sydney), Canada (Centre) et UE (Irlande).

create-audio-transcript-transcribe-step-1b

(cliquez pour agrandir)


c. Saisissez S3 dans la barre de recherche et sélectionnez S3 pour ouvrir la console.

create-audio-transcript-transcribe-step-1c

(cliquez pour agrandir)


d.  Dans le tableau de bord S3, choisissez Créer un compartiment.

Si c'est la première fois que vous créez un compartiment, un écran similaire à celui représenté ici s’affiche.

Si vous avez déjà créé des compartiments S3, votre tableau de bord S3 répertorie tous les compartiments que vous avez créés.

create-audio-transcript-transcribe-step-1d

(cliquez pour agrandir)


e.  Saisissez un nom de compartiment unique. Les noms de compartiments doivent être uniques parmi tous les noms de compartiments existants dans Amazon S3. Plusieurs restrictions s'appliquent aux noms de compartiment S3 également. Sélectionnez ensuite une région où créer votre compartiment.

Sélectionnez Suivant.

create-audio-transcript-transcribe-step-1e

(cliquez pour agrandir)


f.  Vous disposez d’un grand nombre d’options pratiques pour votre compartiment S3 : Gestion des versions, Journalisation de l’accès au serveur, Balises, journalisation au niveau des objets et chiffrement par défaut. Nous n'allons pas activer ces fonctions pour ce didacticiel.

Sélectionnez Suivant.

create-audio-transcript-transcribe-step-1f

(cliquez pour agrandir)


g.  Dans cette étape, vous avez la possibilité d'ajuster les paramètres d’autorisation de votre compartiment S3 pendant sa création.

Conservez les valeurs par défaut, puis cliquez sur Suivant.

create-audio-transcript-transcribe-step-1g

(cliquez pour agrandir)


h.  Vérifiez vos paramètres de configuration, puis cliquez sur Créer un compartiment.

create-audio-transcript-transcribe-step-1h

(cliquez pour agrandir)


i.  Le nouveau compartiment apparaît dans la console S3. Cliquez sur le nom de votre compartiment pour accéder au compartiment. Le nom de votre compartiment ne sera pas identique à celui figurant sur la capture d’écran à droite.

create-audio-transcript-transcribe-step-1i

(cliquez pour agrandir)


j. Vous vous trouvez sur la page d'accueil de votre compartiment.

Sélectionnez Charger.

create-audio-transcript-transcribe-step-1j

(cliquez pour agrandir)


k.  Chargez le fichier transcribe-sample.mp3 en sélectionnant Ajouter des fichiers et le fichier OU en déposant le fichier transcribe-sample.mp3 dans la zone de chargement.

Sélectionnez Charger.

create-audio-transcript-transcribe-step-1k

(cliquez pour agrandir)


l.  Cochez la case en regard du fichier transcribe-sample.mp3 dans votre compartiment. Un panneau d’informations sur le fichier transcribe-sample.mp3 s’affiche. Copiez le lien d’accès au fichier et enregistrez-le pour l'utiliser plus tard dans le didacticiel.

create-audio-transcript-transcribe-step-1l

(cliquez pour agrandir)


Étape 2. Créer une tâche de transcription

Dans cette étape, vous allez créer et exécuter une tâche de transcription en utilisant la console Amazon Transcribe.


a.  Dans la barre de menus supérieure, sélectionnez Services, saisissez Transcribe dans la barre de recherche, puis sélectionnez Amazon Transcribe pour ouvrir la console de service.

create-audio-transcript-transcribe-step-2a

(cliquez pour agrandir)


b.  Sur la page principale de la console Amazon Transcribe, ouvrez le volet de navigation et cliquez sur Tâches de transcription.

c. Sur la page Tâches de transcription, cliquez sur Créer une tâche.

create-audio-transcript-transcribe-step-2b

(cliquez pour agrandir)


d.  Sur la page Créer une tâche de transcription, dans le champ Nom, saisissez exemple-de-tâche-de-transcription.

Comme Langue par défaut, laissez Anglais.

Dans le champ Emplacement du fichier d'entrée sur S3, collez le lien d'accès à l'exemple de fichier dans votre compartiment S3. Le lien d'accès à votre exemple de fichier est différent de celui indiqué sur la capture d'écran à droite.  

Comme Format par défaut, laissez mp3.

Vous pouvez utiliser la fonction Vocabulaire personnalisé pour aider Amazon Translate à reconnaître les mots et les phrases de votre application, comme le nom non anglophone Étienne. Vous n'utiliserez pas cette fonction dans le cadre de ce didacticiel.

create-audio-transcript-transcribe-step-2c

(cliquez pour agrandir)


e.  Comme Emplacement des données par défaut, laissez Amazon (par défaut).

Si vous activez la fonction Identification de canaux, Amazon Transcribe peut traiter l'audio où chaque intervenant est enregistré sur différents canaux, et produire une seule transcription annotée par les étiquettes des canaux.

Si vous activez la fonction Identification des interlocuteurs, Amazon Transcribe reconnaît les changements de l'intervenant et attribue le texte transcrit de manière appropriée.

Aucune de ces options n'est utilisée dans le cadre de ce didacticiel.

Sélectionnez Créer pour lancer votre tâche de transcription.  

create-audio-transcript-transcribe-step-2d

(cliquez pour agrandir)


Étape 3. Vérifier les résultats de la transcription

Dans cette étape, vous allez apprendre à vérifier l'avancement et à examiner les résultats de votre tâche de transcription.


a.  Après avoir cliqué sur le bouton Créer, vous accédez à l’écran Tâches de transcription. Il indique le statut de exemple-de-tâche-de-transcription. Le statut peut être En cours, Terminé ou Échec.

Lorsque le statut est Terminé, cliquez sur le lien exemple-de-tâche-de-transcription dans la colonne Nom pour afficher les résultats de la transcription.

create-audio-transcript-transcribe-step-3a

(cliquez pour agrandir)


b.   Ensuite, les informations de exemple-de-tâche-de-transcription s’affichent. Faites défiler jusqu’au volet Transcription pour afficher la sortie de la tâche de transcription. Dans le volet JSON, vous pouvez voir les résultats de la transcription tels qu’ils seront retournés par l’API Transcribe ou la CLI AWS.

create-audio-transcript-transcribe-step-3b

(cliquez pour agrandir)


Étape 4. Résilier des ressources

Dans cette étape, vous allez supprimer l’exemple de fichier de votre compartiment S3 pour éviter des frais inutiles.


a.  Dans le menu de navigation supérieur, cliquez sur Services, tapez S3 dans la barre de recherche, puis sélectionnez S3 pour ouvrir la console.

create-audio-transcript-transcribe-step-4a

(cliquez pour agrandir)


b.  Faites défiler vos compartiments S3 et recherchez celui que vous avez créé précédemment dans le didacticiel. Cliquez sur le nom du compartiment pour afficher son contenu. Le nom de votre compartiment est différent de celui dans la capture d’écran sur la droite.

create-audio-transcript-transcribe-step-4b

(cliquez pour agrandir)


c.  Sélectionnez le fichier transcribe-sample.mp3 contenu dans votre compartiment, et dans le menu Actions, sélectionnez Supprimer. Confirmez la suppression.

create-audio-transcript-transcribe-step-4c

(cliquez pour agrandir)


Félicitations !

Comme vous l'avez vu dans ce didacticiel, Amazon Transcribe permet de la convertir la voix en texte à grande échelle. Utilisez Amazon Transcribe pour un large éventail de fichiers audio ou vidéo, tels que les appels au service clientèle, les réunions d'affaires, les émissions de télévision et les vidéos à la demande.

 

Apprendre à traduire à grande échelle

Découvrez comment traduire des textes transcrits dans une autre langue en utilisant Amazon Translate dans ce didacticiel de 10 minutes.

Démarrer avec l’API Transcribe ou la CLI

Découvrez comment utiliser l’API et la CLI Amazon Transcribe dans ce tutoriel dans la documentation.

Explorer Amazon Comprehend

Découvrez comment analyser les sentiments dans du texte en utilisant Amazon Comprehend dans ce didacticiel de 10 minutes.