Questions d'ordre général

Q : Qu'est-ce qu'Amazon Transcribe ?

Amazon Transcribe est un service AWS qui facilite la conversion de la parole en texte pour ses clients. Avec la technologie de reconnaissance vocale automatique (ASR), les clients peuvent choisir d'utiliser Amazon Transcribe pour différentes applications commerciales, notamment la transcription d'appels vocaux au service client, la génération de sous-titres pour un contenu audio/vidéo et l'analyse de la signification (textuelle) d'un contenu audio/vidéo.  

Q : Comment Amazon Transcribe interagit-il avec d'autres produits AWS ?

Amazon Transcribe convertit les entrées audio en texte, ce qui permet d'entrevoir différentes perspectives en matière d'applications d'analyse de texte à partir de l'entrée vocale. Par exemple, en utilisant Amazon Comprehend sur les données textuelles converties par Amazon Transcribe, les clients peuvent effectuer une analyse des sentiments ou extraire des entités et des phrases clés. De la même manière, en intégrant Amazon Translate et Amazon Polly, les clients peuvent accepter des entrées vocales dans une certaine langue, les traduire dans une autre et générer des sorties vocales, ce qui permet de stimuler des conversations multilingues en toute efficacité. Il est également possible d'intégrer Amazon Transcribe à Amazon Elasticsearch afin d'effectuer des recherches dans la bibliothèque audio/vidéo à partir d'un texte, et de les indexer. 

Q : Que dois-je savoir avant d'utiliser le service Amazon Transcribe ?

Le service Amazon Transcribe est conçu pour traiter un large éventail de caractéristiques vocales et acoustiques, notamment les variations de volume, d'intensité et de débit de parole. La qualité et le contenu du signal audio (y compris, mais sans s'y limiter, des facteurs tels que le bruit de fond, le chevauchement de locuteurs, les accents ou le changement de langue dans un seul fichier audio) peuvent affecter la précision de la sortie du service. Nous mettons constamment à jour le service afin d'améliorer sa capacité à prendre en charge de nouveaux types de contenu et de variations acoustiques. 

Utilisation d'Amazon Transcribe

Q : Comment les développeurs peuvent-ils accéder à Transcribe ?

La façon la plus simple de commencer avec Amazon Transcribe est de soumettre une tâche en utilisant la console pour transcrire un fichier audio. Vous pouvez appeler le service directement depuis l'interface de ligne de commande AWS ou utiliser l'un des kits SDK pris en charge de votre choix pour l'intégrer à vos applications. Dans un cas comme dans l'autre, vous pouvez commencer à utiliser Amazon Transcribe afin de générer des transcriptions automatiques pour vos fichiers audio avec seulement quelques lignes de code.

Q : Quel type d'entrées Amazon Transcribe prend-il en charge ?

Amazon Transcribe prend en charge les flux audio 16 kHz comme 8 kHz ainsi que différents types d'encodages audio, comme les fichiers WAV, MP3, MP4 et FLAC.

Q : Amazon Transcribe prend-il en charge les transcriptions en temps réel ?

Oui. Amazon Transcribe permet aux utilisateurs d'ouvrir un flux bidirectionnel sur HTTP2. Les utilisateurs peuvent envoyer un flux audio au service et recevoir, en retour, un flux de texte en temps réel.  

Q : Quel est le type d'encodage pris en charge par la transcription en temps réel ?

La transcription en streaming prend actuellement en charge le codage PCM linéaire 16 bits. 

Q : Quelles sont les langues prises en charge par Amazon Transcribe ?

Pour plus d'informations sur la prise en charge des langues, consultez cette page de documentation

Q : Avec quels appareils Amazon Transcribe fonctionne-t-il ?

Amazon Transcribe est compatible avec la plupart des appareils. En général, Amazon Transcribe peut travailler avec tous les appareils qui comprennent un microphone intégré, comme les téléphones, les ordinateurs, les tablettes et les appareils IoT (tels que les systèmes audio embarqués). L'API Amazon Transcribe peut détecter la qualité du flux audio entrant dans l'appareil (8 kHz contre 16 kHz) et sélectionner les modèles acoustiques appropriés pour convertir la parole en texte. En outre, les développeurs peuvent appeler l'API Transcribe par l'intermédiaire de leurs applications pour accéder à la capacité de conversion de la parole en texte (synthèse vocale). 

Q : Existe-t-il des restrictions de taille quant au contenu audio que peut traiter Amazon Transcribe ?

Les appels de service d'Amazon Transcribe sont limités à 4 heures (ou 2 Go) par appel d'API pour notre service par lot. Le service de streaming accepte des connexions ouvertes pouvant durer jusqu'à 4 heures. 

Q : Quels sont les langages de programmation pris en charge par Amazon Transcribe ?

Le service par lot Amazon Transcribe prend en charge .NET, Go, Java, Javascript, PHP, Python et Ruby.
Le service en temps réel Amazon Transcribe prend en charge les kits SDK Java, Ruby et C++. Des supports de kits SDK supplémentaires seront prochainement disponibles. Pour plus d'informations, consultez la page Ressources

Q : Les mots de mon vocabulaire personnalisé ne sont pas reconnus. Que puis-je faire ?

En plus des entrées du vocabulaire personnalisé, le résultat de la reconnaissance vocale dépend d'un certain nombre de facteurs. Par conséquent, il est impossible de garantir qu'un terme inclus dans ce dernier sera correctement reconnu.
Toutefois, l'explication la plus fréquente est que la prononciation du mot personnalisé est incorrecte. Si vous n'avez pas fourni de prononciation pour votre mot personnalisé, essayez d'en créer une. Si c'est déjà fait, assurez-vous qu'elle est correcte ou ajoutez d'autres variantes de prononciation si nécessaire. Pour ce faire, créez plusieurs entrées distinctes dans le champ de prononciation du fichier de vocabulaire personnalisé.

Q : Pourquoi y a-t-il un trop grand nombre de mots personnalisés dans le résultat que j'obtiens ?

Les vocabulaires personnalisés sont optimisés pour une petite liste de mots ciblés. Les vocabulaires plus étendus peuvent générer une quantité excessive de mots personnalisés, en particulier lorsqu'ils contiennent des mots dont la prononciation est similaire. Si votre liste est longue, essayez de la limiter aux mots rares et à ceux qui sont effectivement susceptibles de figurer dans vos fichiers audio. Si vous disposez d'un vocabulaire étendu qui couvre différents cas d'utilisation, scindez-le en plusieurs listes distinctes correspondant à ces derniers. Les mots courts et dont la prononciation est semblable à celle de beaucoup d'autres mots peuvent entraîner une génération excessive (présence d'un trop grand nombre de mots personnalisés dans le résultat). Il est préférable de combiner ces mots avec des termes voisins et de les répertorier sous la forme d'expressions séparées par des traits d'union. Par exemple, vous pouvez inclure le mot personnalisé « A.D. » dans l'expression « convertisseur A.D. ».

Q : Pour indiquer la prononciation, il est possible d'utiliser soit l'alphabet phonétique international, soit les champs SoundsLike de la table de vocabulaire personnalisé. Quelle est la méthode la plus adaptée ?

Avec l'alphabet phonétique international, les prononciations sont plus précises. Utilisez ce système si vous pouvez générer l'alphabet phonétique international (par exemple, à partir d'un lexique incluant des prononciations basées sur cet alphabet ou d'un outil de conversion en ligne).

Q : J'aimerais utiliser l'alphabet phonétique international, mais je ne suis pas expert en linguistique. Existe-t-il un outil en ligne dont je puisse me servir ?

Plusieurs dictionnaires standard tels que l'Oxford English Dictionary ou le Cambridge Dictionary (y compris leurs versions en ligne) indiquent la prononciation en utilisant l'alphabet phonétique international. Il existe également des convertisseurs en ligne (par exemple, easypronunciation.com ou tophonetics.com pour l'anglais). Notez toutefois que dans la plupart des cas, ces outils sont basés sur des dictionnaires sous-jacents et peuvent ne pas générer correctement l'alphabet phonétique international pour certains mots, notamment les noms propres. Amazon Transcribe n'approuve aucun outil tiers.

Q : Dois-je utiliser des normes de l'alphabet phonétique international propres aux variantes d'une même langue (par exemple, anglais américain et anglais britannique) ?

Nous vous conseillons d'utiliser la norme de l'alphabet phonétique international qui convient le mieux aux fichiers audio que vous aurez à traiter. Par exemple, si ces derniers proviennent de personnes s'exprimant en anglais britannique, utilisez cette norme de prononciation. L'ensemble des symboles autorisés par l'alphabet phonétique international peut varier selon les langues et dialectes pris en charge par Amazon Transcribe. Veillez à ce que vos prononciations ne contiennent que les caractères autorisés. Vous trouverez des informations sur les jeux de caractères de l'alphabet phonétique international dans la documentation suivante : https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html#charsets

Q : Comment puis-je indiquer la prononciation à l'aide du champ SoundsLike dans la table de vocabulaire personnalisé ?

Vous pouvez décomposer un mot ou une expression en segments plus petits et indiquer une prononciation pour chacun d'eux en utilisant l'orthographe standard de la langue pour reproduire les sons correspondant au mot. Par exemple, en français, vous pouvez fournir des indices sur la prononciation de l'expression Los-Angeles de la manière suivante : loss-an-djeu-lès. L'indice pour le mot Peter ressemblerait à ceci : pi-teur. Séparez chaque segment de l'indice avec un trait d'union (-). Vous pouvez utiliser tous les caractères autorisés pour la langue d'entrée.

Q : De quelle manière fonctionnent les deux façons d'indiquer les acronymes (avec points et sans points, mais avec prononciations) ?

Si vous utilisez un acronyme qui contient des points, la prononciation basée sur l'orthographe sera générée en interne. Si vous n'utilisez pas de points, veuillez indiquer la prononciation dans le champ prévu à cet effet. Pour certains acronymes, il n'est pas évident de déterminer s'il faut les prononcer en se basant sur leur orthographe ou en les considérant comme des mots (par exemple, ONU est souvent prononcé « o n y » (o-nu) plutôt que « o ɛn y » (O. N. U.)).

Q : Où puis-je trouver des exemples d'utilisation d'une prononciation personnalisée ?

Vous pouvez trouver des échantillons de formats d'entrée et des exemples dans la documentation suivante : https://docs.aws.amazon.com/transcribe/latest/dg/how-vocabulary.html.

Q : Que se passe-t-il si je n'utilise pas le bon alphabet phonétique international ? En cas de doute, est-il plus prudent de ne pas l'utiliser ?

Le système utilisera la prononciation que vous fournissez. Cela devrait augmenter les chances que le mot soit bien reconnu si la prononciation est correcte et correspond à ce qui a été dit. Si vous n'êtes pas sûr de générer le bon alphabet phonétique international, effectuez une comparaison en analysant vos fichiers audio avec un vocabulaire qui contient vos prononciations utilisant l'alphabet phonétique international et avec un vocabulaire qui ne contient que les mots (et, de manière facultative, les formes DisplayAs). Si vous n'indiquez rien pour la prononciation, le service utilisera une approximation, susceptible de mieux fonctionner ou non que votre entrée.

Q : Dans les formulaires DisplayAs, puis-je afficher les jeux de caractères sans lien avec la langue d'origine en cours de transcription (par exemple, indiquer « Rue » sous la forme « 街道 ») ?

Oui. Les expressions ne peuvent utiliser qu'un jeu restreint de caractères pour la langue spécifique. Toutefois, les caractères UTF-8 sont autorisés dans la colonne DisplayAs, à l'exception de « \t » (TAB).

Tarification et disponibilité

Q : Quel est le coût d'utilisation du service ?

Pour en savoir plus, consultez la page Tarification d'Amazon Transcribe.

Q : Quelles sont les régions AWS disponibles pour Amazon Transcribe ?

Consultez le tableau des régions de l'infrastructure mondiale AWS.

Confidentialité des données

Q : Les entrées vocales traitées par Amazon Transcribe sont-elles stockées ? Et comment sont-elles utilisées par AWS ?

Amazon Transcribe peut stocker et utiliser les entrées vocales traitées par le service uniquement pour fournir et assurer le service, afin d'améliorer et de développer la qualité d'Amazon Transcribe et d'autres technologies de Machine Learning et d’intelligence artificielle d'Amazon. L'utilisation de votre contenu est importante pour assurer l'amélioration continue de l'expérience client du service Amazon Transcribe, notamment le développement de technologies associées et la formation à ces dernières. Nous n'utilisons pas les informations personnellement identifiables qui peuvent être présentes dans votre contenu pour proposer à vos utilisateurs finaux ou à vous-même des produits, des services ou du marketing ciblés. Votre confiance, ainsi que la confidentialité et la sécurité de votre contenu, sont notre priorité absolue. Nous mettons en œuvre des contrôles techniques et physiques appropriés et sophistiqués, notamment le chiffrement au repos et en transit, afin d'éviter l'accès non autorisé à votre contenu ou sa divulgation. Nous nous assurons également que notre utilisation respecte nos engagements à votre égard. Consultez https://aws.amazon.com/compliance/data-privacy-faq/ pour en savoir plus. Vous pouvez refuser que votre contenu soit utilisé pour améliorer et développer Amazon Transcribe et d'autres technologies d'apprentissage automatique/intelligence artificielle d'Amazon en contactant AWS Support.

Q : Puis-je supprimer des entrées vocales stockées par Amazon Transcribe ?

Oui. Vous pouvez demander la suppression des entrées vocales associées à votre compte en contactant AWS Support. La suppression des entrées vocales est susceptible de dégrader votre expérience d'utilisation d'Amazon Transcribe.

Q : Qui a accès à mon contenu traité et stocké par Amazon Transcribe ?

Seuls les employés autorisés ont accès à votre contenu traité par Amazon Transcribe. Votre confiance, ainsi que la confidentialité et la sécurité de votre contenu, sont notre priorité absolue. Nous mettons en œuvre des contrôles techniques et physiques appropriés et sophistiqués, notamment le chiffrement au repos et en transit, afin d'éviter l'accès non autorisé à votre contenu ou sa divulgation. Nous nous assurons également que notre utilisation respecte nos engagements à votre égard. Pour en savoir plus, consultez la page https://aws.amazon.com/fr/compliance/data-privacy-faq/.

Q : Suis-je toujours propriétaire de mon contenu traité et stocké par Amazon Transcribe ?

Vous restez en permanence propriétaire de votre contenu, et nous n'utiliserons ce dernier qu'avec votre consentement.

Q : Le contenu traité par Amazon Transcribe est-il transféré en dehors de la région AWS où j'utilise le service ?

Tout contenu traité par Amazon Transcribe est chiffré et stocké au repos dans la région AWS où vous utilisez le service. Certaines parties du contenu traité par Amazon Transcribe peuvent être stockées dans une autre région AWS seulement dans le cadre d'efforts continus d'amélioration et de développement de votre expérience client sur Amazon Transcribe et d'autres technologies d'apprentissage automatique/intelligence artificielle d'Amazon. Si vous contactez AWS Support pour refuser que votre contenu soit utilisé pour améliorer et développer Amazon Transcribe et d'autres technologies d'apprentissage automatique/intelligence artificielle d'Amazon, votre contenu ne sera pas stocké dans une autre région AWS. Vous pouvez demander la suppression des entrées vocales associées à votre compte en contactant AWS Support. Votre confiance, ainsi que la confidentialité et la sécurité de votre contenu, sont notre priorité absolue. Nous mettons en œuvre des contrôles techniques et physiques appropriés et sophistiqués, notamment le chiffrement au repos et en transit, afin d'éviter l'accès non autorisé à votre contenu ou sa divulgation. Nous nous assurons également que notre utilisation respecte nos engagements à votre égard. Pour en savoir plus, consultez la page https://aws.amazon.com/fr/compliance/data-privacy-faq/.

Q : Puis-je utiliser Amazon Transcribe dans le cadre de sites Internet, de programmes ou d'autres applications qui visent les enfants de moins de 13 ans (et qui sont donc concernés par le Children's Online Privacy Protection Act [COPPA]) ?

Oui. Si vous respectez les conditions de service d'Amazon Transcribe, notamment votre obligation de fournir tout avis requis et d'obtenir l'accord parental vérifiable nécessaire selon le COPPA, vous pouvez utiliser Amazon Transcribe dans le cadre de sites Internet, de programmes et d'autres applications visant, entièrement ou partiellement, les enfants de moins de 13 ans.

Q : Comment puis-je déterminer si mon site Internet, mon programme ou mon application sont concernés par le COPPA ?

Pour en savoir plus sur les exigences du COPPA et obtenir des conseils pour déterminer si votre site Internet, votre programme ou toute autre application sont régis par le COPPA, consultez directement les ressources fournies et mises à jour par la Federal Trade Commission des États-Unis. Ce site contient également des informations permettant de déterminer si un service vise, entièrement ou partiellement, les enfants de moins de 13 ans.

En savoir plus sur la tarification d'Amazon Transcribe

Visiter la page de tarification
Prêt à vous lancer ?
Essayez la console Amazon Transcribe
D'autres questions ?
Contactez-nous