Amazon Comprehend ermöglicht die natürliche Sprachverarbeitung, die Erkennung und Schwärzung personenbezogener Daten (PII), die benutzerdefinierte Klassifizierung und Erkennung von Entitäten sowie die Modellierung von Themen. Dies ermöglicht eine breite Palette von Anwendungen, die Rohtext und mit einigen APIs auch Dokumentformate wie PDF und Word analysieren können.

  • Verarbeitung natürlicher Sprache: Amazon-Comprehend-APIs für Entitäterkennung, Sentiment-Analyse, Syntax-Analyse, Schlüsselphrasen-Extraktion und Spracherkennung können verwendet werden, um Erkenntnisse aus natürlichsprachlichem Text zu gewinnen. Diese Anfragen werden in Einheiten von 100 Zeichen gemessen (1 Einheit = 100 Zeichen), mit einer Mindestgebühr von 3 Einheiten (300 Zeichen) pro Anfrage.
  • Personenbezogene Information (PII): Die PII-Erkennung-API findet Stellen ausgewählter personenbezogener Informationen (PII)-Entitäten einem Dokument und kann zur Erstellung von geschwärzten Versionen von Dokumenten verwendet werden. Die Enthält PII-API teilt Ihnen mit, ob ein Dokument die ausgewählte PII enthält oder nicht. Diese Anfragen werden ebenfalls in Einheiten von 100 Zeichen (1 Einheit = 100 Zeichen) gemessen. Pro Anfrage wird ein Mindestpreis in Höhe von 3 Einheiten (300 Zeichen) fällig.
  • Benutzerdefiniertes Comprehend: Die APIs für benutzerdefinierte Klassifizierung und Entitäten können ein benutzerdefiniertes NLP-Modell trainieren, um Text zu kategorisieren und benutzerdefinierte Entitäten zu extrahieren. Asynchrone Inferenz-Anfragen werden in Einheiten von 100 Zeichen gemessen. Pro Anfrage wird ein Mindestpreis in Höhe von 3 Einheiten (300 Zeichen) fällig. Ihnen werden 3 USD pro Stunde für die Modellschulung (nach Sekunden abgerechnet) und 0,50 USD pro Monat für benutzerdefiniertes Modellmanagement in Rechnung gestellt. Für synchrone Inferenzanfragen für benutzerdefinierte Klassifizierung und Entitäten stellen Sie einen Endpunkt mit dem entsprechenden Durchsatz bereit. Die Rechnungsstellung erfolgt vom Zeitpunkt des Starts Ihres Endpunkts bis zu dessen Löschung.
  • Themenmodellierung: Die Themenmodellierung identifiziert relevante Begriffe oder Themen aus einer Sammlung von Dokumenten, die in Amazon S3 gespeichert sind. Es identifiziert die am häufigsten vorkommenden Themen in der Sammlung und ordnet sie in Gruppen an, bevor es feststellt, welche Dokumente zu welchem Thema gehören. Die Kosten werden anhand der Gesamtgröße des verarbeiteten Dokuments pro Auftrag berechnet. Die ersten 100 MB sind in der Flatrate enthalten. Ab 100 MB kostet jedes MB extra.
  • Vertrauen und Sicherheit (neu): Die Comprehend-Toxizitätserkennungs-API kann verwendet werden, um toxische Inhalte aus Texten zu erkennen. In ähnlicher Weise kann die Sicherheitsklassifizierungsfunktion „Comprehend Prompt“ verwendet werden, um unsichere Eingabeaufforderungen für große Sprachmodelle und Anwendungen zu erkennen. Diese Anfragen werden in Einheiten von 100 Zeichen gemessen (1 Einheit = 100 Zeichen), mit einer Mindestgebühr von 3 Einheiten (300 Zeichen) pro Anfrage.
  • Weitere Informationen über die Preise für Amazon Comprehend Medical finden Sie hier.
  • Sie können Ihre Kosten mit Hilfe des AWS-Preisrechners schätzen.
  • Wählen Sie in der Regionsauswahl unten die Region USA Ost (Nord-Virginia) aus, um die Preise für alle APIs anzuzeigen

 

Für Volumen von mehr als 100 Millionen Einheiten pro Monat kontaktieren Sie uns bitte für die Preisgestaltung.
NLP-Anfragen werden in Einheiten von 100 Zeichen gemessen. Pro Anfrage wird ein Mindestpreis in Höhe von 3 Einheiten (300 Zeichen) fällig.

Mit den Amazon Comprehend APIs können Sie sowohl unstrukturierten, rohen Text als auch - mit einigen APIs - andere Textdateien wie PDF- und Word-Dokumente verarbeiten. 

Benutzerdefiniertes Comprehend

Benutzerdefinierte Entitäten und Klassifizierung
Für asynchrone Entitätenerkennung in PDF*-, Word- und reinen Textdokumenten

Inferenz-Anfragen werden in Einheiten von 100 Zeichen gemessen. Pro Anfrage wird ein Mindestpreis in Höhe von 3 Einheiten (300 Zeichen) fällig.

Für synchrone Klassifizierung

Inferenz-Anfragen werden in Einheiten von 100 Zeichen gemessen. Pro Anfrage wird ein Mindestpreis in Höhe von 3 Einheiten (300 Zeichen) fällig.

Für synchrone Klassifizierung und Entitätenerkennung

Die Endpunkte werden in Sekundenabstufungen in Rechnung gestellt, wobei die Mindestdauer 60 Sekunden beträgt. Gebühren fallen ab dem Zeitpunkt des Starts des Endpunkts bis zu dessen Löschung fortlaufend an, auch wenn keine Dokumente analysiert werden.

Eine Inferenz-Einheit (IE) bietet einen Durchsatz von 100 Zeichen/Sekunde auf Ihrem verwalteten Endpunkt. Sie können zusätzliche IEs für mehr Durchsatz bereitstellen. Für jede IE fallen 0,0005 USD pro Sekunde an.

3 USD pro Stunde für Modelltraining

*um Text aus gescannten PDF-Dokumenten zu extrahieren, wird Amazon Textract Detect Document Text API aufgerufen.

Topic-Modellierung

Für die ersten 100 MB

Für jedes MB über 100 MB

Die Kosten werden anhand der Gesamtgröße des verarbeiteten Dokuments pro Topic-Modellierungs-Auftrag berechnet. Die ersten 100 MB sind in der Flatrate enthalten. Ab 100 MB kostet jedes MB extra.

Kostenloses Kontingent

50.000 EINHEITEN TEXT (5 MIO. ZEICHEN)

Amazon Comprehend bietet ein kostenloses Kontingent mit 50 000 Einheiten Text (5 Mio. Zeichen) pro API und Monat.

Zu den berechtigten APIs gehören Schlüsselphrasenextraktion, Sentiment, Targeted Sentiment, Entitätenerkennung, Spracherkennung, Ereigniserkennung, Syntaxanalyse, Detect PII, Contains PII und Prompt Safety Classification.

Hinweis: Custom Comprehend (kundenspezifische Entitäten und kundenspezifische Klassifikation) bietet kein kostenloses Kontingent. Dazu gehören Modelltraining, Inferenz und Modellmanagement.

5 AUFTRÄGE JE BIS ZU 1 MB (Themenmodellierung)

Die kostenlose Stufe von Amazon Comprehend steht sowohl neuen als auch bestehenden AWS-Kunden für 12 Monate zur Verfügung, beginnend mit dem Datum ihrer ersten Amazon Comprehend-Anfrage.

Preisbeispiele zu Amazon Comprehend

Beispiel 1 – Analyse von Kundenkommentaren

Nehmen wir an, Sie haben mit Amazon Comprehend eine Anwendung zur Analyse von Kundenkommentaren in Ihrem Online-Shop entwickelt. Sie haben 10 000 Kundenkommentare erhalten, die jeweils 550 Zeichen umfassen, und Sie befinden sich im zweiten Jahr der Servicenutzung.

Berechnung der Gesamtkosten:

Größe jeder Anfrage = 550 Zeichen

Anzahl der Einheiten pro Anfrage = 6

Gesamtzahl der Einheiten: 10 000 (Anfragen) * 6 (Einheiten pro Anfrage) = 60 000

Preis pro Einheit = 0,0001 USD

Gesamtkosten = [Anz. Einheiten] x [Kosten pro Einheit] = 60.000 x 0,0001 USD = 6,00 USD


Beispiel 2 – Kategorisierung von Dokumenten nach Titeln

Nehmen wir an, Sie haben eine Reihe an Forschungsdokumenten, die insgesamt 240 MB groß sind. Diese Dokumente wollen Sie nach Thema kategorisieren und Ihren Kunden entsprechend ihrer Interessen vorschlagen. Nehmen wir außerdem an, dass Sie sich im zweiten Servicenutzungsjahr befinden und deshalb kein kostenloses Kontingent nutzen können.

Berechnung der Gesamtkosten:

Gesamtanzahl der verarbeiteten Megabyte = 240

Megabyte, die über die Flatrate von 1 USD abgerechnet werden = 100

Megabyte, die mit 0,004 USD pro MB abgerechnet werden = 140 [240-100]

Gesamtkosten des Auftrags = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD


Beispiel 3 – Klassifizierung von Kundenfeedback mit der API Benutzerdefinierte Klassifizierung

Nehmen wir an, Sie möchten ein Klassifizierungstool trainieren, um neues Kundenfeedback von Ihrer Website automatisch zu organisieren. 10 Kunden geben jede Minute Feedback ein und jedes Feedback umfasst 300 Zeichen. Es dauert eine Stunde das benutzerdefinierte Modell zu trainieren, und Sie planen dieses Modell für einen Monat zu behalten. Die Modellschulungskosten betragen daher 3 USD und die Modellspeicherkosten liegen bei 0,50 USD pro Monat. Nehmen wir außerdem an, dass Sie sich im zweiten Servicenutzungsjahr befinden und deshalb kein kostenloses Kontingent nutzen können. 

Um das Feedback asynchron zu klassifizieren, zahlen Sie nach Anzahl der Zeichen in Ihren Dokumenten. Zur Klassifizierung in Echtzeit stellen Sie einen Endpunkt mit ausreichendem Durchsatz bereit, um Ihren Anwendungsfall abzuwickeln, und zahlen für die Betriebszeit des Endpunkts.

Inferenzkostenberechnung für asynchrone Klassifizierung:

Größe der jeweiligen Anfrage pro Tag = 4 320 000 Zeichen [300 Zeichen * 10 Dokumente * 1 440 Minuten]

Anzahl an Einheiten pro Anfrage = 43 200 Einheiten [432 000 Zeichen/100 Zeichen pro Einheit]

Preis pro Einheit = 0,0005 USD

Gesamtinferenzkosten für Einheiten = 21,60 USD [43 200 Einheiten x 0,0005 USD]

Gesamtkosten = 25,10 USD [21,60 USD Inferenz + 3 USD Modelltraining + 0,50 USD Modellspeicher]

Berechnung der Gesamtgebühren für die synchrone Klassifizierung:

Berechnen wir zuerst den erforderlichen Durchsatz. Jede Minute klassifizieren wir 10 Dokumente mit je 300 Zeichen. Das ergibt:

50 Zeichen pro Sekunde [300 Zeichen x 10 Dokumente ÷ 60 Sekunden]

Daher müssen Sie einen Endpunkt mit 1 Inferenzeinheit (IE) bereitstellen, der einen Durchsatz von 100 Zeichen/Sekunde ermöglicht.

Preis für 1 IE = 0,0005 USD pro Sekunde

Kosten fallen je nach Dauer der Aktivität des Endpunkts zur Echtzeitklassifizierung an, aber ungeachtet der Anzahl der Inferenzaufrufe.

Falls Sie Ihren Endpunkt zur Echtzeitklassifizierung 12 Stunden täglich ausführen:

Gesamtkosten für Inferenz = 21,60 USD [0,0005 USD x 3 600 Sekunden x 12 Stunden]

Gesamtkosten = 25,10 USD [21,60 USD Inferenz + 3 USD Modelltraining + 0,50 USD Modellspeicher]

Beachten Sie, dass Kosten für den bereitgestellten Durchsatz und für die Dauer der Aktivität des Endpunkts anfallen. Falls Sie mehr Durchsatz bereitstellen müssen, beträgt der Preis:

Preis für 2 IE = 0,001 USD pro Sekunde [0,0005 USD x 2]

Preis für 3 IE = 0,0015 USD pro Sekunde [0,0005 USD x 3]


Beispiel 4 – Analyse von Kundenkommentaren mithilfe der Benutzerdefinierte-Entität-API

Nehmen wir an, sie möchten ein benutzerdefiniertes Entitätenmodell schulen, um benutzerdefinierte Begriffe aus Kundenfeedback von Ihrer Website automatisch zu extrahieren. Die Schulung dauert 1,5 Stunden, und Sie analysieren 10.000 Abschnitte Kundenfeedback, von denen jeder 550 Zeichen hat. Sie planen, dieses Modell einen Monat lang aufrechtzuerhalten. Nehmen wir außerdem an, dass Sie sich im zweiten Servicenutzungsjahr befinden und deshalb kein kostenloses Kontingent nutzen können.

Berechnung der Gesamtkosten:

Größe jeder Anfrage = 5,500,000 Zeichen

Anzahl an Einheiten pro Anfrage = 55,000 Einheiten [5.500.000 Zeichen / 100 Zeichen pro Einheit]

Preis pro Einheit = 0,0005 USD

Gesamtkosten der Einheiten = 27,5 USD [55,000 Einheiten x 0,0005 USD]

Gesamtanzahl der Stunden für Modellschulung = 1,5 Stunden

Preis pro Stunde = 3 USD

Gesamtkosten für Modellschulung = 4.5 USD [1,5 Stunden x 3 USD]

Anzahl an Monaten für Modell-Verwaltung = 1 Monat

Preis pro Monat = 0,50 USD 

Gesamtkosten für Modellverwaltung = 0,50 USD [1 Monat x 0,50 USD]

Gesamtkosten = 37 USD [27,5 USD + 4,5 USD + 0,50 USD]


Beispiel 5 – Extrahieren von Ereignissen und den zugehörigen Informationen mithilfe der Ereigniserkennung

Nehmen wir an, Sie möchten 3 Ereignistypen aus 3 000 Artikeln mit je 500 Zeichen extrahieren und Sie befinden sich im zweiten Jahr der Nutzung des Services.

Berechnung der Gesamtkosten:

Anzahl der verarbeiteten Zeichen = 1.500.000 Zeichen [3.000 Artikel x 500 Zeichen]

Anzahl der verarbeiteten Einheiten = 45.000 Einheiten [1.500.000 x 3 Ereignistypen ÷ 100 Zeichen pro Einheit]

Preis pro Einheit = 0,003 USD

Gesamtkosten der Einheiten = 135 USD [45 000 Einheiten x 0,003 USD]


Beispiel 6 – Identifizieren von Dokumenten mit PII unter Verwendung der Enthält-PII-API

Nehmen wir an, Sie haben mit Amazon Comprehend eine Anwendung zur Analyse von Kundenkommentaren in Ihrem Online-Shop entwickelt. Sie haben 10 000 Kundenkommentare erhalten, die jeweils 550 Zeichen lang sind, und Sie müssen ermitteln, welche Dokumente PII enthalten, damit sie an einem sicheren Ort gespeichert werden können. Gehen wir davon aus, dass Sie sich im zweiten Jahr der Nutzung des Services befinden.

Berechnung der Gesamtkosten:

Größe jeder Anfrage = 550 Zeichen

Anzahl der Einheiten pro Anfrage = 6

Gesamteinheiten = 60 000 [10 000 Anfragen x 6 Einheiten pro Anfrage]

Preis pro Einheit = 0,000002 USD

Gesamtkosten = 0,12 USD [60 000 Einheiten x 0,000002 USD]


Beispiel 7 – Schwärzen von PII aus Dokumenten mit der PII-erkennen-API

Nehmen wir an, Sie haben mit Amazon Comprehend eine Anwendung zur Analyse von Kundenkommentaren in Ihrem Online-Shop entwickelt. Sie haben 10 000 Kundenkommentare erhalten, die jeweils 550 Zeichen lang sind, und Sie müssen geschwärzte Versionen der Dokumente erstellen, bevor diese archiviert werden. Gehen wir davon aus, dass Sie sich im zweiten Jahr der Nutzung des Services befinden.

Berechnung der Gesamtkosten:

Größe jeder Anfrage = 550 Zeichen

Anzahl der Einheiten pro Anfrage = 6

Gesamteinheiten = 60 000 [10 000 Anfragen x 6 Einheiten pro Anfrage]

Preis pro Einheit = 0,0001 USD

Gesamtkosten = 6 USD [60 000 Einheiten x 0,0001 USD]

Beispiel 8 – Extrahieren von Hypothekenantragseinheiten mit der Benutzerdefinierte-Entität-API

Nehmen wir an, Sie möchten ein benutzerdefiniertes Entitätsextraktionsmodell trainieren, um 10 benutzerdefinierte Entitäten aus einem Hypothekenantrag zu extrahieren. Jeden Tag bewerben sich einhundert Kunden, die jeweils ein 10-seitiges gescanntes PDF-Dokument mit 2 500 Zeichen pro Seite einreichen. Nehmen wir an, dass wir mit Amazon Textract den Text aus jeder einzelnen verarbeiteten Seite extrahieren müssen, bevor wir mit der Detect Document Text API Entitäten extrahieren. Es dauert eine Stunde das benutzerdefinierte Modell zu trainieren und Sie planen dieses Modell für einen Monat zu behalten. Die Modellschulungskosten betragen daher 3 USD und die Modellspeicherkosten liegen bei 0,50 USD pro Monat. Nehmen wir außerdem an, dass Sie sich im zweiten Servicenutzungsjahr befinden und deshalb kein kostenloses Kontingent nutzen können. Um benutzerdefinierte Entitäten asynchron zu extrahieren, zahlen Sie nach Anzahl der Zeichen in Ihren Dokumenten. Um Entitäten in Echtzeit zu extrahieren, stellen Sie einen Endpunkt mit ausreichendem Durchsatz bereit, um Ihren Anwendungsfall abzuwickeln und zahlen für die Betriebszeit des Endpunkts.

Inferenzkostenberechnung für asynchrone Klassifizierung:

Umfang jeder Anfrage pro Tag = 2 500 000 Zeichen [100 Anwendungen/Tag * 10 Dokumente * 2 500 Zeichen]

Anzahl an Einheiten pro Anfrage = 25 000 Einheiten [2 500 000 Zeichen / 100 Zeichen pro Einheit]

Preis pro Einheit = 0,0005 USD

Gesamtinferenzkosten für Einheiten = 12,50 USD [25 000 Einheiten x 0,0005 USD]

Amazon-Textract-Kosten für Detect Document Text API = 1,50 USD [100 Anwendungen/Tag * 10 Dokumente * 0,0015 USD Preis pro Seite, bis zu 1M Seiten]

Gesamtpreis = 17,50 USD [12,50 USD Inferenz + 1.50 USD Textract + 3 USD Modelltraining + 0,50 USD Modellspeicher]

 

Beispiel 9 – Analyse der Antworten auf Mitarbeiterbefragungen

Nehmen wir an, Sie haben eine Anwendung mit Amazon Comprehend Targeted Sentiment entwickelt, um Antworten auf Mitarbeiterumfragen für Ihr Unternehmen zu analysieren. Sie haben 100 000 Umfrageantworten mit jeweils 350 Zeichen erhalten und nutzen den Service schon das zweite Jahr.

Berechnung der Gesamtkosten:

Größe jeder Anfrage = 350 Zeichen

Anzahl der Einheiten pro Anfrage = 4

Gesamteinheiten: 100 000 (Anfragen) x 4 (Einheiten pro Anfrage) = 400 000

Preis pro Einheit = 0,0001 USD (von 0–10 Mio. Einheiten)

Gesamtpreis = [Anz. Einheiten] x [Preis pro Einheit] = 400 000 x 0,0001 USD = 40,00 USD

 

Beispiel 10 – Nachweis von Toxizität in Online-Kommentaren auf einer Website

Nehmen wir an, Sie haben mithilfe von Amazon Comprehend eine Anwendung entwickelt, um Toxizität in Kommentaren auf Ihrer Website zu erkennen. Sie haben 100 Millionen Kundenkommentare erhalten, die jeweils 100 Zeichen lang sind, und Sie müssen herausfinden, welche Kommentare giftiger Natur sind und redigiert werden sollten. Gehen wir davon aus, dass Sie sich im zweiten Jahr der Nutzung des Services befinden.

            Berechnung der Gesamtkosten:

            Größe jeder Anfrage = 100 Zeichen

            Anzahl der Einheiten pro Anfrage = 1 Insgesamt

            Einheiten = 100 Mio. IUs [100 Mio. Kommentare x 1 Einheit pro Anfrage]

            Preis pro Einheit = 0,0001 USD [von 0 bis 10 Mio. IE] + 0,00005 USD [von 10 Mio. IE – 50 Mio. IE] + 0,000025 USD [von 50 Mio. IE – 100 Mio. IE]

            Gesamtpreis = [Anz. Einheiten] x [Preis pro Einheit]

            = [10 MX0,001 USD] + [40 MX 0,00005 USD] + [50 MX0,000025 USD]

            = 1 000 USD + 2 000 USD + 1 250 USD

            = 4 250 USD

Beispiel 11 – Erkennung unsicherer Eingabeaufforderungen in generativen KI-Anwendungen

Nehmen wir an, Sie haben mithilfe von Amazon Comprehend eine Anwendung entwickelt, um unsichere Eingabeaufforderungen zu erkennen, wenn Ihre Benutzer mit Ihrem generativen KI-Produkt interagieren. Sie haben 10 Millionen Eingabeaufforderungen mit jeweils 500 Zeichen erhalten, und Sie müssen herausfinden, welche Eingabeaufforderungen unsicher sind. Gehen wir davon aus, dass Sie sich im zweiten Jahr der Nutzung des Services befinden.

            Berechnung der Gesamtkosten:

            Größe jeder Anfrage = 500 Zeichen

            Anzahl der Einheiten pro Anfrage = 5

            Gesamtzahl der Einheiten = 50 Mio. IU [10 Mio. Kommentare x 5 Einheiten pro Anfrage]

            Preis pro Einheit = 0,0001 USD [von 0 bis 10 Mio. IE] + 0,00005 USD [von 10 Mio. IE – 50 Mio. IE] + 0,000025 USD [von 50 Mio. IE – 100 Mio. IE]

            Gesamtpreis = [Anz. Einheiten] x [Preis pro Einheit]

            = [10 M X 0,001] + [40 M X 0,00005]

            = 1 000 USD + 2 000 USD

            = 3 000 USD

Weitere Informationen zu Amazon Comprehend-Funktionen

Seite mit Funktionen besuchen
Sind Sie startbereit?
Registrieren
Haben Sie noch Fragen?
Kontakt