Amazon Comprehend est un service de traitement du langage naturel (NLP) qui utilise l'apprentissage-machine pour identifier les idées d'un texte. Amazon Comprehend fournit des API d'extraction d'expressions clés, d'analyse des sentiments, de reconnaissance d'entités, de modélisation de rubriques et de détection de la langue pour vous permettre d'intégrer facilement un traitement du langage naturel à vos applications. Vous devez simplement appeler les API d'Amazon Comprehend dans votre application, et leur fournir l'emplacement du document ou du texte source. Les API génèreront des entités, des expressions clés, des sentiments et des langues au format JSON, que vous pouvez utiliser dans votre application.

Extraction d'expressions clés

L'API d'extraction d'expressions clés génère des expressions ou des sujets de discussion clés, ainsi qu'un indice de fiabilité qui vient confirmer l'importance de l'expression.

  • Exemple : dans cet exemple, un client compare son appareil photo reflex numérique à un appareil photo instantané. L'API extrait les expressions clés, compte le nombre de fois qu'une expression clé est répétée, et fournit un indice de fiabilité par rapport aux résultats.

    Modèle de texte : je suis passionné de photographie, et je me sers très souvent de mon appareil photo reflex numérique ou de mon appareil photo instantané, que j'emporte avec moi car j'en fais un usage occasionnel. Bien que la puissance et la commodité de mon appareil photo reflex numérique soient inégalées, un appareil photo instantané est pour moi synonyme de magie. Peut-être que c'est le fait de prendre des photos sur une véritable pellicule, ou de savoir que chaque cliché donne un objet physique unique (et c'est un phénomène spécial dans le monde d'aujourd'hui, où l'on trouve des photos à la pelle sur Instagram et Facebook). Ce dont je suis sûr, c'est que ces photos sont très amusantes à prendre, et que les yeux des gens s'illuminent quand vous sortez un appareil photo instantané lors d'une fête.

    Expressions clés Nombre Fiabilité
    passionné de photographie 1 0,99
    mon appareil photo reflex numérique 2 0,97
    mon appareil photo instantané 2 0,99
    usage occasionnel 1 0,99
    puissance et commodité 1 0,94
    véritable pellicule 1 0,99
    chaque cliché 1 0,92
    un objet physique unique 1 0,99
    aujourd'hui 1 0,91
    monde 1 0,99
    Instagram et Facebook 1 0,99

Analyse des sentiments

L'API d'analyse des sentiments extrait le sentiment général qui se dégage d'un texte (positif, négatif, sans opinion ou mitigé).

Reconnaissance d'entités

L'API de reconnaissance d'entités extrait les entités nommées (« personnes », « endroits »« lieux », etc.), qui sont classées automatiquement en fonction du texte fourni.

Détection de la langue

L'API de détection de la langue identifie automatiquement du texte écrit dans plus de 100 langues et extrait la langue dominante, ainsi qu'un indice de fiabilité qui vient confirmer la prédominance de cette langue.

Modélisation de rubriques

La modélisation de rubriques identifie des termes ou des sujets pertinents dans une collection de documents stockés sur Amazon S3. Elle identifie les sujets les plus courants de la collection et les classe par groupes avant d'associer tel ou tel document à une rubrique.

  • Exemple : si vos documents (Doc1.txt, Doc2.txt, Doc3.txt et Doc4.txt) sont stockés sur Amazon S3, et que vous indiquez leur emplacement à Amazon Comprehend, le service va analyser les documents et en extraire deux vues :

    1. Regroupement de mots clés qui constituent des rubriques.

    Chaque groupe de mots clés est associé à un groupe de rubriques. Le poids fait référence à la prévalence d'un mot clé au sein du groupe. Les mots clés qui possèdent le poids le plus proche de 1 sont ceux qui en révèlent le plus sur le contexte du groupe de rubriques.
    Groupe de rubriques Mots clés Poids
    1 Amazon 0,87
    1 Seattle 0,65
    2 Vacances 0,78
    2 Shopping 0,67
    Chaque groupe de mots clés est associé à un groupe de rubriques. Le poids fait référence à la prévalence d'un mot clé au sein du groupe. Les mots clés qui possèdent le poids le plus proche de 1 sont ceux qui en révèlent le plus sur le contexte du groupe de rubriques.

    2. Regroupement des documents par rubriques.

    Nom du document Groupe de rubriques Proportion
    Doc1.txt 1 0,87
    Doc2.txt 1 0,65
    Doc3.txt 2 0,78
    Doc4.txt 2 0,67
    Chaque document est associé à un groupe de rubriques en fonction de la proportion du poids des mots clés du groupe de rubriques présents dans le document.

Support multilingue

Amazon Comprehend peut effectuer des analyses sur des textes écrits en anglais et en espagnol. Cela vous permet de créer des applications capables de détecter du texte écrit dans différentes langues, de convertir le texte en anglais ou en espagnol grâce à Amazon Translate, puis d'utiliser Amazon Comprehend afin d'effectuer une analyse du texte.

En savoir plus sur la tarification d'Amazon Comprehend

Visiter la page de tarification
Prêt à vous lancer ?
S'inscrire
D'autres questions ?
Contactez-nous