Amazon Comprehend ist ein Service der natürlichen Sprachverarbeitung (Natural Language Processing, NLP), der mittels Machine Learning Einblicke aus Ihrem Text gewinnt. Amazon Comprehend stellt APIs für die Schlüsselbegriff-Extraktion, Stimmungsanalyse, Entitätserkennung, Themenmodellierung und Spracherkennung zur Verfügung, sodass Sie NLP ganz einfach in Ihre Anwendungen integrieren können. Dazu rufen Sie einfach die Amazon Comprehend-APIs in Ihrer Anwendung auf und geben den Speicherort des Quelldokuments oder -texts an. Die APIs geben die Entitäten, die wichtigen Phrasen, die Stimmung und die Sprache im JSON-Format aus, das Sie in Ihrer Anwendung verwenden können.

Schlüsselphrasenextraktion

Die Schlüsselphrasenextraktions-API gibt Schlüsselphrasen oder Sprachpunkte wieder und weist einen Zuversichtlichkeitswert zu, um sicherzustellen, dass es sich um eine Schlüsselphrase handelt.

  • Beispiel: In diesem Beispiel vergleicht ein Kunde eine DSLR-Kamera mit einer Instant-Film-Kamera. Die API extrahiert die Schlüsselphrasen, zählt, wie oft eine bestimmte Schlüsselphrase wiederholt wird, und gibt am Ende einen Vertrauenswert für das Ergebnis aus.

    Beispieltext: Ich bin ein begeisterter Fotograf und man sieht mich meistens, wie ich meine DSLR-Kamera oder meine Instant-Film-Kamera dazu nutze, private Fotos zu machen. Meine DSLR ist in Sachen Leistung und Benutzerfreundlichkeit unschlagbar, aber meine Instant-Film-Kamera hat einfach etwas Magisches. Vielleicht liegt es daran, dass man seine Aufnahmen tatsächlich auf Film bannt oder dass jedes Foto ein einzigartiges, greifbares Artefakt ist (was in der Welt heute, in der Instagram und Facebook die Macht übernommen und Millionen Fotos durch das Internet kursieren, schon etwas Besonderes ist.) Ich weiß nur, dass es mir eine Menge Spaß macht, damit zu arbeiten, und das Funkeln in den Augen der Leute, wenn man so ein Foto auf einer Party aus dem Ärmel zaubert, ist einfach unbezahlbar.

    Schlüsselphrase Anzahl Zuversichtlichkeit
    ein begeisterter Fotograf 1 0,99
    meine DSLR 2 0,97
    meine Instant-Film-Kamera 2 0,99
    privat 1 0,99
    Leistung und Benutzerfreundlichkeit 1 0,94
    tatsächlich auf Film 1 0,99
    jedes Foto 1 0,92
    ein einzigartiges, greifbares Artefakt 1 0,99
    heute 1 0,91
    Welt 1 0,99
    Instagram und Facebook 1 0,99

Stimmungsanalyse

Die Stimmungsanalyse-API gibt die allgemeine Stimmung eines Texts (positiv, negativ, neutral oder gemischt) wieder.

Syntaxanalyse

Die Amazon Comprehend Syntax-API bietet Kunden die Möglichkeit, Text mithilfe von Aufgliederung in Token und Parts of Speech (PoS) zu analysieren und Wortgrenzen und Bezeichnungen wie Substantive und Adjektive im Text zu erkennen.

Entitätenerkennung

Die Entitätenerkennungs-API gibt die benannten Entitäten ("Menschen", "Plätze", "Orte" usw.) wieder. Sie werden automatisch basierend auf dem bereitgestellten Text kategorisiert.

Spracherkennung

Die Spracherkennungs-API identifiziert automatisch die Sprache eines Texts (100 Sprachen verfügbar) und gibt die dominante Sprache mit einem Zuversichtlichkeitswert wieder.

Topic-Modellierung

Die Topic-Modellierung identifiziert relevante Begriffe oder Themen aus einer Sammlung von Dokumenten, die in Amazon S3 gespeichert ist. Es identifiziert die am häufigsten vorkommenden Themen in der Sammlung und ordnet sie in Gruppen an, bevor es feststellt, welche Dokumente zu welchem Thema gehören.

  • Beispiel: Wenn Ihre Dokumente (Doc1.txt, Doc2.txt, Doc3.txt und Doc4.txt) in Amazon S3 gespeichert werden und Sie Amazon Comprehend den Speicherort angeben, analysiert Comprehend die Dokumente und gibt zwei Ansichten wieder:

    1. Gruppieren der Schlüsselwörter, die Themen sind.

    Jede Gruppe von Schlüsselwörtern ist mit einer Themengruppe verbunden. Die Gewichtung hängt von der Häufigkeit des Schlüsselworts in der Gruppe ab. Schlüsselwörter, deren Gewichtung am nächsten an 1 liegt, geben am meisten Aufschluss über den Kontext der Themengruppe.
    Themengruppe Schlüsselwörter Gewichtung
    1 Amazon 0,87
    1 Seattle 0,65
    2 Feiertage 0,78
    2 Shoppen 0,67
    Jede Gruppe von Schlüsselwörtern ist mit einer Themengruppe verbunden. Die Gewichtung hängt von der Häufigkeit des Schlüsselworts in der Gruppe ab. Schlüsselwörter, deren Gewichtung am nächsten an 1 liegt, geben am meisten Aufschluss über den Kontext der Themengruppe.

    2. Gruppieren der Dokumente nach Themen.

    Dokumentname Themengruppe Verhältnis
    Doc1.txt 1 0,87
    Doc2.txt 1 0,65
    Doc3.txt 2 0,78
    Doc4.txt 2 0,67
    Jedes Dokument wird einer Themengruppe zugeordnet. Entscheidend ist hierbei das Verhältnis der gewichteten Schlüsselwörter einer Themengruppe, die im Dokument vorhanden sind.

Support mehrerer Sprachen

Amazon Comprehend kann eine Textanalyse für englisch- und spanischsprachige Texte durchführen. So können Sie Anwendungen entwickeln, die Text in mehreren Sprachen erkennen. Dann können Sie den Text mit Amazon Translate ins Englische oder Spanische übersetzen lassen und danach eine Textanalyse mit Amazon Comprehend durchführen.

Weitere Informationen zu den Amazon Comprehend-Preisen

Zur Seite mit den Preisen
Sind Sie startbereit?
Registrieren
Haben Sie Fragen?
Kontakt