Questions fréquentes (FAQ) sur Amazon Transcribe

Questions d'ordre général

Q : Qu'est-ce qu'Amazon Transcribe ?

Amazon Transcribe est un service d'intelligence artificielle (IA) d'AWS qui vous permet de convertir facilement la parole en texte. Avec la technologie de reconnaissance vocale automatique (ASR), vous pouvez utiliser Amazon Transcribe pour différentes applications commerciales, notamment la transcription d'appels vocaux au service client, la génération de sous-titres pour un contenu audio/vidéo et l'analyse de la signification (textuelle) d'un contenu audio/vidéo.

Q : Comment Amazon Transcribe interagit-il avec d'autres produits AWS ?

Amazon Transcribe convertit les entrées audio en texte, ce qui permet d'entrevoir différentes perspectives en matière d'applications d'analyse de texte à partir de l'entrée vocale. Par exemple, en utilisant Amazon Comprehend sur les données textuelles converties par Amazon Transcribe, vous pouvez effectuer une analyse des sentiments ou extraire des entités et des phrases clés. De même, en l'intégrant avec Amazon Translate et Amazon Polly, vous pouvez accepter des entrées vocales dans une langue, les traduire dans une autre et générer des sorties vocales, ce qui facilite les conversations multilingues. Il est également possible d'intégrer Amazon Transcribe à Amazon Kendra ou Amazon OpenSearch afin d'effectuer des recherches dans une bibliothèque audio/vidéo à partir d'un texte, et de les indexer. Pour en savoir plus, consultez la solution d'analyse d'appels et assistance aux agents, d'analyse post-appel, MediaSearch ou Content Analysis.

Q : Que dois-je savoir avant d'utiliser Amazon Transcribe ?

Amazon Transcribe est conçu pour traiter un large éventail de caractéristiques vocales et acoustiques, notamment les variations de volume, d'intensité et de débit de parole. La qualité et le contenu du signal audio (y compris, mais sans s'y limiter, des facteurs tels que le bruit de fond, le chevauchement de locuteurs, les accents ou le changement de langue dans un seul fichier audio) peuvent affecter la précision de la sortie du service. Nous mettons constamment à jour le service afin d'améliorer sa capacité à prendre en charge de nouveaux types de contenu et de variations acoustiques.

Utilisation d'Amazon Transcribe

Q : Comment les développeurs peuvent-ils accéder à Amazon Transcribe ?

La façon la plus simple de commencer est de soumettre une tâche en utilisant la console pour transcrire un fichier audio. Vous pouvez appeler le service directement depuis l'interface de ligne de commande AWS ou utiliser l'un des kits SDK pris en charge de votre choix pour l'intégrer à vos applications. Dans un cas comme dans l'autre, vous pouvez commencer à utiliser Amazon Transcribe afin de générer des transcriptions automatiques pour vos fichiers audio avec seulement quelques lignes de code.

Q : Amazon Transcribe prend-il en charge les transcriptions en temps réel ?

Oui. Amazon Transcribe vous permet d'ouvrir un flux bidirectionnel sur HTTP2. Vous pouvez envoyer un flux audio au service et recevoir, en retour, un flux de texte en temps réel. Veuillez consulter la page de documentation pour plus de détails.

Q : Quel est le type d'encodage pris en charge par la transcription en temps réel ?

Les types de supports pris en charge diffèrent entre les transcriptions par lots et les transcriptions en streaming, bien que les formats sans perte soient recommandés pour les deux. Veuillez consulter la page de documentation pour plus de détails.

Q : Quelles sont les langues prises en charge par Amazon Transcribe ?

Pour plus d'informations sur la prise en charge des langues, consultez cette page de documentation.

Q : Avec quels appareils Amazon Transcribe fonctionne-t-il ?

Amazon Transcribe est compatible avec la plupart des appareils. En général, il peut travailler avec tous les appareils qui comprennent un microphone intégré, comme les téléphones, les ordinateurs, les tablettes et les appareils IoT (tels que les systèmes audio embarqués). L'API Amazon Transcribe peut détecter la qualité du flux audio entrant dans l'appareil (8 kHz contre 16 kHz) et sélectionner les modèles acoustiques appropriés pour convertir la parole en texte. En outre, les développeurs peuvent appeler l'API Amazon Transcribe par l'intermédiaire de leurs applications pour accéder à la capacité de conversion de la parole en texte (synthèse vocale).

Q : Existe-t-il des restrictions de taille quant au contenu audio que peut traiter Amazon Transcribe ?

Les appels de service d'Amazon Transcribe sont limités à quatre heures (ou 2 Go) par appel d'API pour notre service par lot. Le service de streaming accepte des connexions ouvertes pouvant durer jusqu'à quatre heures.

Q : Quels sont les langages de programmation pris en charge par Amazon Transcribe ?

Le service par lot Amazon Transcribe prend en charge .NET, Go, Java, JavaScript, PHP, Python et Ruby. Le service en temps réel Amazon Transcribe prend en charge les kits SDK Java, Ruby et C++. Un support de kits SDK supplémentaire sera prochainement disponible. Pour plus de détails, consultez la page Ressources et la page de documentation.

Q : Les mots de mon vocabulaire personnalisé ne sont pas reconnus. Que puis-je faire ?

En plus des entrées du vocabulaire personnalisé, le résultat de la reconnaissance vocale dépend d'un certain nombre de facteurs. Par conséquent, il est impossible de garantir qu'un terme inclus dans ce dernier sera correctement reconnu. Toutefois, l'explication la plus fréquente est que la prononciation du mot personnalisé est incorrecte. Si vous n'avez pas fourni de prononciation pour votre mot personnalisé, essayez d'en créer une. Si c'est déjà fait, assurez-vous qu'elle est correcte ou ajoutez d'autres variantes de prononciation si nécessaire. Pour ce faire, créez plusieurs entrées distinctes dans le champ de prononciation du fichier de vocabulaire personnalisé. Pour en savoir plus, reportez-vous à la documentation du vocabulaire personnalisé.

Q : Pourquoi y a-t-il un trop grand nombre de mots personnalisés dans le résultat que j'obtiens ?

Les vocabulaires personnalisés sont optimisés pour une petite liste de mots ciblés. Les vocabulaires plus étendus peuvent générer une quantité excessive de mots personnalisés, en particulier lorsqu'ils contiennent des mots dont la prononciation est similaire. Si votre liste est longue, essayez de la limiter aux mots rares et à ceux qui sont effectivement susceptibles de figurer dans vos fichiers audio. Si vous disposez d'un vocabulaire étendu qui couvre différents cas d'utilisation, scindez-le en plusieurs listes distinctes correspondant à ces derniers. Les mots courts et dont la prononciation est semblable à celle de beaucoup d'autres mots peuvent entraîner une génération excessive (présence d'un trop grand nombre de mots personnalisés dans le résultat). Il est préférable de combiner ces mots avec des termes voisins et de les répertorier sous la forme d'expressions séparées par des traits d'union. Par exemple, vous pouvez inclure le mot personnalisé « A.D. » dans l'expression « convertisseur A.D. ».

Q : Pour indiquer la prononciation, il est possible d'utiliser soit l'alphabet phonétique international, soit les champs SoundsLike de la table de vocabulaire personnalisé. Quelle est la méthode la plus adaptée ?

Avec l'alphabet phonétique international, les prononciations sont plus précises. Utilisez ce système si vous pouvez générer l'alphabet phonétique international (par exemple, à partir d'un lexique incluant des prononciations basées sur cet alphabet ou d'un outil de conversion en ligne).

Q : J'aimerais utiliser l'alphabet phonétique international, mais je ne suis pas expert en linguistique. Existe-t-il un outil en ligne dont je puisse me servir ?

Plusieurs dictionnaires standard tels que l'Oxford English Dictionary ou le Cambridge Dictionary (y compris leurs versions en ligne) indiquent la prononciation en utilisant l'alphabet phonétique international. Il existe également des convertisseurs en ligne (par exemple, easypronunciation.com ou tophonetics.com pour l'anglais). Notez toutefois que dans la plupart des cas, ces outils sont basés sur des dictionnaires sous-jacents et peuvent ne pas générer correctement l'alphabet phonétique international pour certains mots, notamment les noms propres. Amazon Transcribe n'approuve aucun outil tiers.

Q : Dois-je utiliser des normes de l'alphabet phonétique international propres aux variantes d'une même langue (par exemple, anglais américain et anglais britannique) ?

Vous devez utiliser l'alphabet phonétique international approprié pour les fichiers audio que vous allez traiter. Par exemple, si vous comptez traiter des fichiers audio provenant d'interlocuteurs britanniques, utilisez la norme de prononciation de l'anglais britannique. L'ensemble des symboles autorisés par l'alphabet phonétique international peut varier selon les langues et dialectes pris en charge par Amazon Transcribe. Veillez à ce que vos prononciations ne contiennent que les caractères autorisés. Des détails sur les jeux de caractères de l'alphabet phonétique international peuvent être trouvés dans la documentation : Vocabulaires personnalisés

Q : Comment puis-je indiquer la prononciation à l'aide du champ SoundsLike dans la table de vocabulaire personnalisé ?

Vous pouvez décomposer un mot ou une expression en segments plus petits et indiquer une prononciation pour chacun d'eux en utilisant l'orthographe standard de la langue pour reproduire les sons correspondant au mot. Par exemple, en français, vous pouvez fournir des indices sur la prononciation de l'expression Los-Angeles de la manière suivante : loss-an-djeu-lès. L'indice pour le mot Peter ressemblerait à ceci : pi-teur. Séparez chaque segment de l'indice avec un trait d'union (-). Vous pouvez utiliser tous les caractères autorisés pour la langue d'entrée. Pour plus d'informations, consultez la page Vocabulaires personnalisés.

Q : De quelle manière fonctionnent les deux façons d'indiquer les acronymes (avec points et sans points, mais avec prononciations) ?

Si vous utilisez un acronyme qui contient des points, la prononciation basée sur l'orthographe sera générée en interne. Si vous n'utilisez pas de points, veuillez indiquer la prononciation dans le champ prévu à cet effet. Pour certains acronymes, il n'est pas évident de savoir s'ils ont une prononciation orthographique ou une prononciation de type mot. Par exemple, OTAN se prononce souvent « o tɑ̃ » (o-ten) plutôt que « o te a ɛn » (O. T. A. N.). Pour plus d'informations, consultez la page Vocabulaires personnalisés.

Q : Où puis-je trouver des exemples d'utilisation d'une prononciation personnalisée ?

Vous pouvez trouver des exemples de formats d'entrée et des exemples dans cette documentation.

Q : Que se passe-t-il si je n'utilise pas le bon alphabet phonétique international ? En cas de doute, est-il plus prudent de ne pas l'utiliser ?

Le système utilisera la prononciation que vous fournissez. Cela devrait augmenter les chances que le mot soit bien reconnu si la prononciation est correcte et correspond à ce qui a été dit. Si vous n'êtes pas sûr de générer le bon alphabet phonétique international, effectuez une comparaison en analysant vos fichiers audio avec un vocabulaire qui contient vos prononciations utilisant l'alphabet phonétique international et avec un vocabulaire qui ne contient que les mots (et, de manière facultative, les formes DisplayAs). Si vous n'indiquez rien pour la prononciation, le service utilisera une approximation, susceptible de mieux fonctionner ou non que votre entrée.

Q : Dans les formulaires DisplayAs, puis-je afficher les jeux de caractères sans lien avec la langue d'origine en cours de transcription (par exemple, indiquer « Rue » sous la forme « 街道 ») ?

Oui. Les expressions ne peuvent utiliser qu'un jeu restreint de caractères pour la langue spécifique. Toutefois, les caractères UTF-8 sont autorisés dans la colonne DisplayAs, à l'exception de « \t » (TAB).

Q : La correction automatique de contenu ou des données d'identification personnelle (PII) est-elle disponible à la fois pour les API de lot et de streaming dans Transcribe ?

Oui, Amazon Transcribe prend en charge la correction automatique de contenu ou de PII à la fois pour les API de lot et de streaming.

Q : Quelles langues sont prises en charge pour la rédaction de contenu automatique ou l'identification et la correction de PII ?

Référez-vous à la documentation d'Amazon Transcribe pour des informations sur la disponibilité des langues de correction automatique de contenu ou de PII.

Question : La correction automatique de contenu supprime-t-elle également les informations personnelles sensibles issues de l'audio source ?

Non, cette fonctionnalité ne supprime pas les informations personnelles sensibles de l'audio source. Cependant, Amazon Transcribe Call Analytics supprime les informations personnelles sensibles à la fois des transcriptions et de la source audio. Rendez-vous sur ce lien pour plus de détails sur la façon dont l'analyse des appels peut supprimer les données audio. Vous pouvez également supprimer vous-même des informations personnelles de l'audio source en utilisant les horodatages de début et de fin fournis dans les transcriptions modifiées pour chaque instance d'un énoncé d'informations personnelles identifiées. Veuillez vous référer à cette solution de rédaction audio pour les API Transcribe standard.

Cependant, les API spécialisées Amazon Transcribe Call Analytics suppriment les informations personnelles sensibles à la fois des transcriptions et de la source audio. Pour en savoir plus, consultez la documentation sur la rédaction de documents audio de Call Analytics.

Q : Puis-je utiliser la correction automatique du contenu pour supprimer des informations personnelles provenant des transcriptions de texte existantes ?

Non, la correction automatique de contenu fonctionne uniquement sur un fichier audio en entrée.

Q : Que dois-je savoir avant d'utiliser la correction automatique de contenu ?

La correction automatique de contenu est conçue pour identifier et supprimer les informations personnelles identifiables (PII). Cependant, en raison de la nature prédictive du machine learning, elle peut ne pas identifier et supprimer toutes les instances d'informations personnelles dans une transcription générée par le service. Vous devez vérifier tous les résultats donnés par la correction automatique de contenu pour vous assurer qu'elle répond à vos besoins.

Q : Existe-t-il des différences entre la correction automatique de contenu et les API de lot ou de streaming ?

Oui, deux fonctionnalités supplémentaires sont prises en charge par la correction automatique de contenu dans l'API de streaming, qui ne sont pas prises en charge par l'API de lot. Vous pouvez choisir d'identifier uniquement les PII et de ne par les supprimer lorsque vous utilisez la correction de contenu avec l'API de streaming. Vous avez également la possibilité d'identifier ou de supprimer des types de PII spécifiques grâce à l'API de streaming. Par exemple, vous pouvez simplement supprimer le numéro de sécurité sociale et les coordonnées de la carte de crédit et conserver les autres PII telles que le(s) nom(s) et l'adresse mail.

Q : Dans quelles régions AWS la correction automatique de contenu ou de PII sont-elles disponibles ?

Veuillez vous référer à la documentation Amazon Transcribe pour en savoir plus sur la disponibilité de la correction automatique de contenu et de PII pour les API de lot et de streaming dans les régions AWS.

Q : Quelles API prennent en charge l'identification automatique de la langue ?

L'identification automatique de la langue est actuellement prise en charge pour les API de traitement par lots et de streaming.

Question : Quelles langues Amazon Transcribe peut-il identifier automatiquement ?

Amazon Transcribe peut identifier toutes les langues prises en charge par l'API de traitement par lots et de streaming. Pour plus de détails sur les langues prises en charge et les fonctionnalités spécifiques à chaque langue, rendez-vous ici.

Q : Amazon Transcribe peut-il identifier plusieurs langues dans un même fichier audio ?

Amazon Transcribe prend en charge l'identification multilingue pour les lots. Pour en savoir plus, consultez ce lien.

Q : Est-il possible de restreindre la liste des langues à disponibles au choix pour l'identification automatique des langues ?

Oui, vous pouvez spécifier une liste de langues que votre bibliothèque multimédia pourrait contenir. Lorsque vous fournissez une liste de langues, la langue identifiée sera choisie dans cette liste. Si aucune langue n'est spécifiée, le système traite le fichier audio par rapport à toutes les langues prises en charge par Amazon Transcribe et sélectionne la plus probable. La précision de l'identification des langues est meilleure lorsqu'une liste de sélection de langues est fournie. Pour en savoir plus, consultez ce lien.

Tarification et disponibilité

Q : Quel est le coût d'utilisation du service ?

Pour en savoir plus, consultez la page Tarification d'Amazon Transcribe.

Q : Dans quelles régions AWS Amazon Transcribe est-il disponible ?

Consultez le tableau des régions de l'infrastructure mondiale AWS. Rendez-vous ici pour plus de détails sur les points de terminaison et les quotas d'Amazon Transcribe.

Confidentialité des données

Q : Les entrées vocales traitées par Amazon Transcribe sont-elles stockées ? Et comment sont-elles utilisées par AWS ?

Amazon Transcribe peut stocker et utiliser les entrées vocales traitées par le service uniquement pour fournir et assurer le service, afin d'améliorer et de développer la qualité d'Amazon Transcribe et d'autres technologies de Machine Learning et d'intelligence artificielle d'Amazon. L'utilisation de votre contenu est importante pour assurer l'amélioration continue de l'expérience client du service Amazon Transcribe, notamment le développement de technologies associées et la formation à ces dernières. Nous n'utilisons pas les informations personnellement identifiables qui peuvent être présentes dans votre contenu pour proposer à vos utilisateurs finaux ou à vous-même des produits, des services ou du marketing ciblés. Votre confiance, ainsi que la confidentialité et la sécurité de votre contenu, sont notre priorité absolue. Nous mettons en œuvre des contrôles techniques et physiques appropriés et sophistiqués, notamment le chiffrement au repos et en transit, afin d'éviter l'accès non autorisé à votre contenu ou sa divulgation. Nous nous assurons également que notre utilisation respecte nos engagements à votre égard. Pour en savoir plus, reportez-vous à la page https://aws.amazon.com/fr/compliance/data-privacy-faq/. Vous pouvez utiliser une stratégie d'exclusion AWS Organizations pour refuser l'utilisation de votre contenu pour améliorer et développer la qualité d'Amazon Transcribe et d'autres technologies de machine learning/intelligence artificielle d'Amazon. Pour en savoir plus sur la désinscription, consultez Gestion de la politique de désinscription des services d'IA.

Q : Puis-je supprimer les données et les artefacts associés aux tâches de transcription stockées par Amazon Transcribe ?

Oui. Vous pouvez utiliser les API Delete disponibles pour supprimer les données et autres artefacts associés aux tâches de transcription. Si vous rencontrez des difficultés, contactez AWS Support.

Q : Qui a accès à mon contenu traité et stocké par Amazon Transcribe ?

Seuls les employés autorisés ont accès à votre contenu traité par Amazon Transcribe. Votre confiance, ainsi que la confidentialité et la sécurité de votre contenu, sont notre priorité absolue. Nous mettons en œuvre des contrôles techniques et physiques appropriés et sophistiqués, notamment le chiffrement au repos et en transit, afin d'éviter l'accès non autorisé à votre contenu ou sa divulgation. Nous nous assurons également que notre utilisation respecte nos engagements à votre égard. Pour en savoir plus, reportez-vous à la page https://aws.amazon.com/fr/compliance/data-privacy-faq/.

Q : Suis-je toujours propriétaire de mon contenu traité et stocké par Amazon Transcribe ?

Vous demeurez propriétaire de votre contenu et nous n'utiliserons ce dernier qu'avec votre consentement.

Q : Que deviennent mes données utilisées pour l'entraînement des modèles de langues personnalisés ? En serais-je toujours propriétaire ?

Lorsque vous soumettez des données textuelles qui sont utilisées pour entraîner un modèle dédié, vous êtes propriétaire des données textuelles initiales et du modèle personnalisé généré. Les données textuelles ne sont ni stockées ni utilisées pour améliorer notre moteur général de reconnaissance vocale. Les modèles produits à l'aide du CLM sont autonomes et accessibles uniquement par vous.

Q. Le service ne conserve pas mes données d'entraînement. Cela a-t-il des inconvénients ou entraîne-t-il une dégradation de la qualité de transcription ou de l'expérience globale du service ?

La qualité de la transcription ne se dégrade pas si notre service ne stocke pas vos données d'entraînement. Vous avez un accès permanent à tout modèle de langue personnalisé créé à partir de vos données d'entraînement. Les données d'entraînement initiales téléchargées sont supprimées de nos systèmes. Vous avez besoin d'une assistance technique ; c'est le seul inconvénient. Nous ne conservons pas vos données d'entraînement initiales et ne pouvons donc pas facilement accéder à ces ressources ou aux artefacts intermédiaires connexes au cas où vous auriez besoin de l'équipe de support pour enquêter sur d'éventuels problèmes de service. Vous aurez certes accès au support, mais pas aussi rapidement, car il se peut que nous devions vous demander des informations supplémentaires.

Q : Comment puis-je réutiliser les données pour de futures mises à jour ou améliorations du modèle ?

Les données d'entraînement n'étant pas stockées, le même ensemble de données et toutes les données supplémentaires devront être chargés à nouveau pour entraîner de nouveaux modèles. Vous serez averti dès qu'une mise à jour du modèle de base fourni par Amazon Transcribe aura lieu. Pour tirer parti du dernier modèle de base, vous devez soumettre vos données pour entraîner un nouveau modèle. Vous aurez alors non seulement le modèle personnalisé initial que vous avez généré précédemment, mais aussi la nouvelle version à utiliser.

Q. Comment puis-je supprimer un modèle ?

Vous pouvez, si vous le souhaitez, supprimer tout modèle de langue du client que vous avez généré.

Q : Le contenu traité par Amazon Transcribe est-il transféré en dehors de la région AWS où j'utilise le service ?

Tout contenu traité par Amazon Transcribe est chiffré et stocké au repos dans la région AWS où vous utilisez le service. Certaines parties du contenu traité par Amazon Transcribe peuvent être stockées dans une autre région AWS seulement dans le cadre d'efforts continus d'amélioration et de développement de votre expérience client sur Amazon Transcribe et d'autres technologies d'apprentissage automatique/intelligence artificielle d'Amazon. Si vous contactez AWS Support pour refuser que votre contenu soit utilisé pour améliorer et développer Amazon Transcribe et d'autres technologies d'apprentissage automatique/intelligence artificielle d'Amazon, votre contenu ne sera pas stocké dans une autre région AWS. Vous pouvez demander la suppression des entrées vocales associées à votre compte en contactant AWS Support. Votre confiance, ainsi que la confidentialité et la sécurité de votre contenu, sont notre priorité absolue. Nous mettons en œuvre des contrôles techniques et physiques appropriés et sophistiqués, notamment le chiffrement au repos et en transit, afin d'éviter l'accès non autorisé à votre contenu ou sa divulgation. Nous nous assurons également que notre utilisation respecte nos engagements à votre égard. Pour en savoir plus, reportez-vous à la page https://aws.amazon.com/fr/compliance/data-privacy-faq/.

Q : Puis-je utiliser Amazon Transcribe dans le cadre de sites Internet, de programmes ou d'autres applications qui visent les enfants de moins de 13 ans (et qui sont donc concernés par le Children's Online Privacy Protection Act [COPPA]) ?

Oui. Si vous respectez les conditions de service d'Amazon Transcribe, notamment votre obligation de fournir tout avis requis et d'obtenir l'accord parental vérifiable nécessaire selon le COPPA, vous pouvez utiliser Amazon Transcribe dans le cadre de sites Internet, de programmes et d'autres applications visant, entièrement ou partiellement, les enfants de moins de 13 ans.

Q : Comment puis-je déterminer si mon site Internet, mon programme ou mon application sont concernés par le COPPA ?

Pour plus d'informations sur les exigences du COPPA et pour des directives permettant de déterminer si votre site web, votre programme ou toute autre application est régi par le COPPA, reportez-vous directement aux ressources fournies et mises à jour par la Federal Trade Commission des États-Unis. Ce site contient également des informations permettant de déterminer si un service vise, entièrement ou partiellement, les enfants de moins de 13 ans.

Amazon Transcribe Call Analytics

Q : Qu'est-ce qu'Amazon Transcribe Call Analytics ?

Amazon Transcribe Call Analytics est une API à technologie IA qui fournit des transcriptions d'appels riches et des informations de conversations exploitables que vous pouvez ajouter aux applications d'appels pour améliorer l'expérience client et la productivité des agents. La solution combine de puissants modèles de synthèse vocale et de traitement du langage naturel (NLP) personnalisé qui sont entraînés spécifiquement pour comprendre les appels du service clients et les appels sortants des services de ventes. Dans le cadre des solutions AWS Contact Center Intelligence (CCI), cette API est un centre de contact agnostique. Elle permet aux clients et FIL d'ajouter plus facilement des fonctionnalités d'analytique d'appels à leurs applications.

Q : Que puis-je faire avec Amazon Transcribe Call Analytics ?

Amazon Transcribe Call Analytics peut faire des analyses en temps réel et post-appel. Avec Call Analytics, les développeurs peuvent ajouter rapidement de précieuses fonctionnalités d'intelligence (par exemple les scores de ressentis des clients et des agents, les pilotes d'appels, les catégories d'appels et la synthèse d’appels) directement en tant qu'une sortie d'API à n'importe quelle application d'appels entrants ou sortants. Les cas d'utilisation courants comprennent l'assistance aux agents, la synthèse, les alertes des superviseurs et l'analyse des appels. Voici deux exemples de solutions open source basées sur Transcribe Call Analytics : Analyse d'appels en temps réel avec assistance à l'agent et Analyse post-appel.

Q : Comment démarrer avec Amazon Transcribe Call Analytics ?

Vous pouvez utiliser Transcribe Call Analytics via les API et la console de gestion AWS. Vous pouvez créer et contrôler des tâches d'analytique via l'API ou la console. Dans la console, vous voyez une liste des tâches d'analytique, ainsi qu'une page comportant les détails des tâches avec les paramètres d'entrée et une prévisualisation de la sortie JSON. Par ailleurs, vous pouvez créer et modifier des catégories via les API ou la console pour la fonction automatisée de catégorisation de contacts.

Q : Quelles sont les langues prises en charge par Amazon Transcribe Call Analytics ?

Référez-vous à la documentation d'Amazon Transcribe pour des informations sur la disponibilité des langues d'Amazon Transcribe Call Analytics.

Q : Dans quelles régions le service AWS Amazon Transcribe Call Analytics est-il disponible ?

Veuillez vous référer à la documentation des services régionaux AWS pour obtenir des informations sur la couverture de la région AWS pour Amazon Transcribe Call Analytics. Veuillez noter que la synthèse générative des appels d'Amazon Transcribe Call Analytics est disponible en version préliminaire uniquement dans l'est des États-Unis (Virginie du Nord) et l'ouest des États-Unis (Oregon).

Q. La synthèse générative des appels est-elle disponible avec l'API Transcribe Call Analytics en temps réel et post-appel ?

Actuellement, la synthèse générative des appels n'est disponible qu'avec l'API Transcribe Call Analytics pour les analyses post-appel.

Q. Comment s'effectue la tarification Amazon Transcribe Call Analytics ?

L'API Amazon Transcribe Call Analytics est facturée séparément des API Amazon Transcribe standard. Pour plus d'informations, consultez la page Tarification Amazon Transcribe.

Amazon Transcribe Medical

Q : Qu'est-ce qu'Amazon Transcribe Medical ?

Amazon Transcribe Medical est un service de reconnaissance vocale automatique (ASR) qui permet aux développeurs d'ajouter facilement des fonctionnalités de conversion de la parole en texte à leurs applications. Grâce à Amazon Transcribe Medical, vous pouvez transcrire de manière rapide et précise une dictée médicale ou un discours conversationnel en texte à diverses fins, telles que l'enregistrement des notes du médecin ou le traitement dans l'analyse de texte en aval pour extraire des informations significatives.

Q : Que puis-je faire avec Amazon Transcribe Medical ?

Amazon Transcribe Medical utilise des modèles de machine learning avancés pour transcrire avec précision le discours médical en texte. Transcribe Medical peut générer des transcriptions textuelles qui peuvent être utilisées pour prendre en charge une variété de cas d'utilisation, couvrant le flux de travail de documentation clinique et la surveillance de la sécurité des médicaments (pharmacovigilance) jusqu'au sous-titrage pour la télémédecine et même l'analyse des centres de contact dans les domaines de la santé et des sciences de la vie.

Q. Dois-je être un expert en reconnaissance vocale automatique (ASR) pour utiliser Amazon Transcribe Medical ?

Non, aucune expertise en ASR ou en machine learning n'est requise pour utiliser Amazon Transcribe Medical. Il vous suffit d'appeler l'API de Transcribe Medical et le service se charge de traiter le machine learning requis dans le backend pour transcrire le discours médical en texte.

Q : Comment démarrer avec Amazon Transcribe Medical ?

Vous pouvez utiliser Amazon Transcribe Medical via AWS Management Console ou le kit SDK. Référez-vous à cette page de documentation technique pour de plus amples détails.

Amazon Transcribe Medical propose une offre gratuite pour que vous puissiez tester le service. Consultez la page relative à la tarification pour en savoir plus.

Q : Quelles sont les langues prises en charge par Amazon Transcribe Medical ?

Amazon Transcribe Medical prend actuellement en charge la transcription médicale en anglais américain.

Q : Quelles sont les spécialités médicales prises en charge par Amazon Transcribe Medical ?

Amazon Transcribe Medical prend en charge la transcription pour une liste croissante de spécialités de soins primaires et de soins spécialisés. Consultez notredocumentation pour la liste complète des spécialités médicales prises en charge.

Q. Dans quelles régions AWS Amazon Transcribe Medical est-il disponible ?

Veuillez vous référer à la documentation des services régionaux AWS pour obtenir des informations sur la couverture de la région AWS pour Amazon Transcribe Medical.

Q. Quelle est la tarification d'Amazon Transcribe Medical ?

Référez-vous à la page de tarification d'Amazon Transcribe Medical pour en savoir plus sur la tarification.

Q. Amazon Transcribe Medical HIPAA est-il éligible à la loi HIPAA ?

Oui.

Q : Le contenu traité par Amazon Transcribe Medical est-il utilisé à des fins autres que la fourniture du service ?

Amazon Transcribe Medical n'utilise pas le contenu traité par le service pour une raison autre que la fourniture et la maintenance du service. Le contenu traité par le service n'est pas utilisé pour développer ou améliorer la qualité d'Amazon Transcribe Medical ou d'autres technologies Amazon de machine learning/d'intelligence artificielle.

Q : Amazon Transcribe Medical acquiert-il de nouvelles fonctionnalités au fil du temps ?

Oui. Grâce au machine learning, Amazon Transcribe Medical est formé en continu pour s'adapter au mieux à vos cas d'utilisation. Amazon Transcribe Medical ne stocke ni n'utilise pas les données client utilisées avec le service pour former les modèles.

Q : Que dois-je savoir avant d'utiliser le service Amazon Transcribe Medical ?

Amazon Transcribe Medical ne remplace pas les conseils, diagnostics ou traitements d'un professionnel de la santé. Avec vos utilisateurs finaux, il est essentiel de faire preuve de discrétion et d'user de votre propre expérience/jugement afin de déterminer l'exactitude, la complétude, l'actualité et la pertinence de toute information fournie par Amazon Transcribe Medical. Avec vos utilisateurs finaux, vous êtes seuls responsables des décisions, conseils, actions et/ou inactions concernant Amazon Transcribe Medical.

Amazon Transcribe Medical peut ne pas identifier avec précision les informations de santé protégées dans tous les cas, et ne répond pas aux exigences de désidentification des informations de santé protégées conformément à l'HIPAA. Vous êtes responsable de la vérification des résultats fournis par Amazon Transcribe Medical, afin de vous assurer qu'ils répondent à vos besoins.

Modèles de langue personnalisés

Q : Quelles sont les fonctionnalités offertes aujourd'hui par les modèles de langues personnalisés ?

Vous pouvez utiliser les modèles de langues personnalisés (CLM) pour entraîner et développer des modèles linguistiques propres au domaine. Les modèles de langues personnalisés (CLM) prennent actuellement en charge l'anglais australien, l'anglais britannique, le hindi, l'anglais américain et l'espagnol américain pour la transcription par lots, ainsi que l'anglais américain pour la transcription en streaming. CLM prend en charge l'utilisation simultanée du vocabulaire personnalisé pour la transcription par lots.

Q : De quels volume et type de données d'entraînement ai-je besoin ? Comment puis-je obtenir les données ? Les données doivent-elles être sous un format spécifique ?

Les données textuelles doivent être pertinentes pour l'audio à transcrire en utilisant le modèle personnalisé. Elles doivent contenir autant de mots, de phrases et de combinaisons de mots spécifiques au domaine que possible. Nous recommandons d'utiliser un texte d'au moins 100 000 mots et de 10 000 000 de mots au plus. Les ressources de données textuelles peuvent être obtenues à partir de n'importe quelle source interne ou publique (par exemple, en utilisant le texte des sites Web des clients). Nous recommandons que chaque fichier de texte simple contienne 200 000 mots ou plus, la taille globale du fichier ne devant pas dépasser 1 Go. Le texte doit être en UTF-8 et avoir une phrase par ligne. Chaque phrase doit contenir un signe de ponctuation. Il incombe aux utilisateurs de vérifier l'orthographe, de supprimer les caractères de formatage et de valider le codage.

Q : Comment puis-je utiliser les modèles de langues personnalisés (CLM) ?

Pour entraîner un modèle de langue personnalisé, les clients doivent simplement transférer les données textuelles dans un compartiment Amazon S3. Ils peuvent ensuite utiliser la console de service Amazon Transcribe pour charger et traiter les données afin d'entraîner un modèle de langue personnalisé. L'entraînement est entièrement automatisé et ne nécessite qu'une intervention minimale de la part de l'utilisateur. Une fois que le modèle personnalisé final est prêt, il est livré sur le compte AWS du client pour la transcription de fichiers audio spécifiques au domaine. Les clients peuvent en outre entraîner plusieurs modèles personnalisés pour d'autres cas d'utilisation différents.

Q : Des améliorations sont-elles certaines ? La collecte de données textuelles en vaut-elle la peine ?

Les améliorations ne sont pas garanties. Le changement de performance dépendra non seulement du degré de correspondance entre les données textuelles et l'audio, mais aussi de la quantité de données fournies. En général, il est préférable d'avoir un maximum de données possible. Cependant, le plus important est que les données doivent couvrir les mots et les séquences de mots censés se trouver dans les fichiers audio que vous avez l'intention de transcrire. L'amélioration de la précision de la transcription sera tributaire de la qualité des données d'entraînement ainsi que du cas d'utilisation. Dans certains scénarios, la définition générale des points de référence indique une amélioration de la précision relative pouvant aller jusqu'à 10 à 15 %.

Q : Combien de temps dure l'entraînement d'un modèle ? Quand pourrai-je l'utiliser ?

En règle générale, il faut entre 6 et 10 heures pour entraîner un modèle. La durée de l'entraînement est fonction de la taille de l'ensemble des données. Le modèle personnalisé est prêt à l'emploi directement à la fin de l'entraînement.

Q : Comment pourrai-je utiliser le modèle ? Comment saurai-je que le modèle entraîné fonctionne mieux que le modèle générique fourni par Amazon Transcribe ?

Le modèle sera livré sur votre compte sous un identifiant de modèle attribué par vous avant le processus d'entraînement. Pour pouvoir utiliser le modèle, vous devez ajouter un drapeau avec l'ID du modèle à la demande de transcription. Vous devez tester le modèle sur vos fichiers audio et comparer la sortie avec les résultats obtenus par le moteur générique.

Q : Combien de modèles de langues personnalisés puis-je entraîner ? Puis-je faire activer plusieurs modèles simultanément pour mon compte ?

Vous pouvez entraîner simultanément jusqu'à 5 modèles différents à tout moment par compte AWS. Pour chaque compte, vous pouvez stocker un maximum de 10 modèles par défaut. S'il faut en sauvegarder davantage, vous pouvez augmenter la limite de service ici.

Q : Les modèles audio personnalisés sont-ils pris en charge ?

Non. Les modèles audio personnalisés ne sont pas pris en charge. Les modèles de langue personnalisés sont créés à partir de données textuelles qui sont pertinentes pour votre cas d'utilisation ou votre domaine.

En savoir plus sur la tarification d'Amazon Transcribe

Visiter la page de tarification

Prêt à vous lancer ?

Essayez la console Amazon Transcribe

D'autres questions ?

Contactez-nous