Amazon Transcribe

Reconnaissance vocale automatique

Amazon Transcribe est un service de reconnaissance vocale automatique (ASR) qui permet aux développeurs d'ajouter facilement une fonctionnalité de conversion de la parole en texte à leurs applications. À l'aide de l'API Amazon Transcribe, vous pouvez analyser des fichiers audio stockés dans Amazon S3 et faire en sorte que le service renvoie un fichier texte de la parole transcrite.

Le service Amazon Transcribe peut être utilisé dans de nombreuses applications courantes, notamment la transcription d'appels passés à des services clients et la génération de sous-titres sur du contenu audio et vidéo. Le service peut transcrire des fichiers audio stockés dans des formats courants (par ex., WAV et MP3), avec des horodatages pour chaque mot afin que vous puissiez localiser facilement l'audio dans la source d'origine en recherchant le texte. Amazon Transcribe apprend et s'améliore constamment pour suivre l'évolution du langage.

AWS re:Invent 2017 Introducing Amazon Transcribe

Fonctionnalités principales

Transcriptions faciles à lire

La plupart des systèmes de reconnaissance vocale génèrent une chaîne de texte sans ponctuation. Amazon Transcribe utilise l'apprentissage profond pour automatiquement ponctuer et mettre en forme le texte afin qu'il soit plus lisible et utilisé tel quel.

Prise en charge des flux de téléphonie

La qualité sonore des conversations téléphoniques enregistrées est généralement faible. Le service Amazon Transcribe a été spécialement conçu pour offrir une haute précision lors de l'utilisation de flux de téléphonie pour permettre des applications telles que la transcription d'appels passés à des services clients.  

Prise en charge de plusieurs langues

Amazon Transcribe peut transcrire automatiquement de la parole en anglais américain et en espagnol. D'autres langues seront bientôt prises en charge.    

 

Une API facile à utiliser

L'API Amazon Transcribe facilite la conversion de la parole en texte. Aucune programmation complexe n'est nécessaire. Il suffit d'appeler l'API à l'aide de quelques lignes de code, et Transcribe renvoie le texte de votre fichier audio stocké dans Amazon S3.

Prise en charge du vocabulaire personnalisé (prochainement)

Amazon Transcribe vous permet d'enrichir et de personnaliser votre vocabulaire de reconnaissance vocale. Vous pouvez ajouter de nouveaux mots (ainsi que leur prononciation) au vocabulaire de base et générer des transcriptions extrêmement précises propres à votre cas d'utilisation, même lorsque les énoncés incluent une terminologie spécialisée et du jargon ou des noms de produit uniques. Cette fonction vous permet de gagner du temps et élimine tout travail d'édition supplémentaire en vous évitant d'avoir à apporter des corrections par la suite.

Génération d'horodatages

Amazon Transcribe renvoie un horodatage pour chaque mot afin que vous puissiez facilement localiser l'audio dans l'enregistrement d'origine en recherchant le texte.

 

Reconnaissance de plusieurs locuteurs (prochainement)

Amazon Transcribe peut reconnaître lorsque le locuteur change et attribuer le texte transcrit de manière appropriée. Cela peut considérablement réduire la charge de travail nécessaire pour transcrire de l'audio avec plusieurs locuteurs comme les appels téléphoniques, les entretiens et les émissions de télévision.

Cas d'utilisation

Amazon Transcribe peut assurer la transcription dans différents cas d'utilisation, notamment le service client, le sous-titrage, la recherche et la conformité.

Amélioration du service client

En convertissant une entrée audio en texte, Amazon Transcribe vous permet de créer des applications d'analyse capables de rechercher et d'analyser une entrée vocale. Les centres de contacts clients peuvent utiliser Amazon Transcribe pour transcrire des interactions vocales et explorer les données afin d'obtenir des informations à l'aide d'autres services AWS tels qu'Amazon Comprehend pour extraire le sens et l'intention de conversations.

Flux de sous-titres/sous-titrage codé

Amazon Transcribe peut aider les producteurs de contenu et les diffuseurs multimédias à améliorer la portée et l'accès en générant automatiquement des sous-titres horodatés qui peuvent être affichés avec le contenu vidéo.

Catalogage d'archives audio

Le service vous permet de transcrire des ressources audio et vidéo en des archives entièrement interrogeables pour la surveillance de la conformité et la gestion des risques. Les clients peuvent utiliser Amazon Transcribe pour convertir de l'audio en texte, et se servir d'Amazon ElasticSearch pour indexer et réaliser une recherche textuelle dans leur bibliothèque audio/vidéo.

Références client

RingDNA réunit un moteur d'accélération des ventes d'entreprise et une plate-forme de communication vocale. Les équipes de ventes internes utilisent RingDNA pour augmenter considérablement la productivité, prendre part à des conversations commerciales plus intelligentes, obtenir des prédictions commerciales et encadrer les représentants pour réussir plus rapidement que jamais. 

« RingDNA est une plate-forme de communication de bout en bout destinée aux équipes commerciales. Des centaines d'entreprises utilisent RingDNA pour augmenter considérablement la productivité, prendre part à des conversations commerciales plus intelligentes, obtenir des prédictions commerciales, améliorer leur taux de réussite et encadrer les représentants pour réussir plus rapidement que jamais. L'un des éléments essentiels de l'intelligence artificielle conversationnelle de RingDNA nécessite la meilleure technologie de conversion de la parole en texte pour assurer la transcription de chaque appel téléphonique. RingDNA est enthousiaste concernant Amazon Transcribe, car le service fournit une reconnaissance vocale de haute qualité à l'échelle, ce qui nous aide à mieux transcrire chaque appel en texte. »

Howard Brown – PDG et fondateur de RingDNA

Isentia, dont le siège se trouve à Sydney, en Australie, est un fournisseur de premier plan de renseignements médiatiques pour la région Asie-Pacifique. L'entreprise possède 18 bureaux dans la région et compte plus de 5 000 clients dans le monde entier, dont 84 des 100 plus grandes marques internationales. Les produits d'Isentia aident les clients à prendre des décisions plus éclairées et plus opportunes dans le domaine des affaires et de la communication.

« Chez Isentia, nous permettons à nos clients d'analyser et de surveiller la couverture médiatique de leurs marques. Nous créons plus de 13 000 résumés de contenus radio et télévisuels par jour. Grâce à Amazon Transcribe, nous pouvons transcrire tous les contenus audio/vidéo que nous surveillons et analyser les données textuelles avec Amazon Clair. Des fonctions telles que les horodatages et la ponctuation nous permettent d'effectuer très facilement des recherches dans les données et d'explorer et de présenter des informations essentielles pour nos clients. »

Andrea Walsh – responsable informatique, Isentia

En savoir plus sur la tarification d'Amazon Transcribe

Visiter la page de tarification
Prêt à vous lancer ?
S'inscrire à la version préliminaire
D'autres questions ?
Contactez-nous