Alle extrahierten Daten werden mit Koordinaten des Begrenzungsrahmens zurückgegeben. Dabei handelt es sich um einen Polygonrahmen, der die einzelnen identifizierten Daten umfasst, z. B. ein Wort, eine Zeile, eine Tabelle oder sogar einzelne Zellen innerhalb einer Tabelle. Auf diese Weise kann geprüft werden, woher ein Wort oder eine Zahl im Ausgangsdokument stammt. Zudem können sich Benutzer damit in Systemen für die Dokumentsuche orientieren, die Scans von Originaldokumenten als Suchergebnis zurückgeben. Bei der Suche in Krankenakten nach Details zur Patientengeschichte können sich die Benutzer beispielsweise das Quelldokument leicht notieren und für künftige Suchvorgänge merken.
Optische Zeichenerkennung
Amazon Textract nutzt die optische Zeichenerkennung (OCR), um gedruckten Text, Handschrift und Zahlen beim Scannen oder beim Rendering von Dokumenten, wie z. B. juristischen Dokumenten, oder beim Scannen von Büchern, automatisch zu erkennen.
Analyze Lending (Kreditvergabe analysieren)
Analyze Lending API ist eine verwaltete, vorkonfigurierte API für die intelligente Dokumentenverarbeitung, mit der die Extraktion von Informationen aus Kreditpaketen vollständig automatisiert wird. Kunden laden einfach ihre Darlehensunterlagen in die API von Analyze Lending hoch und die vorgefertigten Machine-Learning-Modelle klassifizieren und teilen das Dokumentenpaket nach Dokumententyp auf.
Formularextraktion
Sie können Schlüssel-Wert-Paare in Dokumentenbildern automatisch erkennen und den Kontext ohne manuellen Eingriff beibehalten. Ein Schlüssel-Wert-Paar ist ein Satz von verknüpften Datenelementen. In einem Dokument ist zum Beispiel das Feld „Vorname“ der Schlüssel und „Jane“ ist der Wert. So lassen sich die extrahierten Daten leicht in eine Datenbank importieren oder als Variable in einer Anwendung bereitstellen. Bei herkömmlichen OCR-Lösungen werden Schlüssel und Werte als einfacher Text extrahiert und ihre Beziehung zueinander geht verloren, sofern nicht für jedes Formular hartkodierte Regeln erstellt und verwaltet werden.
Tabellenextraktion
Amazon Textract behält die Zusammensetzung der in den Tabellen gespeicherten Daten während der Extraktion bei. Dies ist hilfreich für Dokumente, die größtenteils aus strukturierten Daten bestehen, z. B. Finanzberichte oder medizinische Unterlagen mit Tabellen in Spalten und Zeilen. Sie können die extrahierten Daten automatisch in eine Datenbank mit einem vordefinierten Schema laden. Beispielsweise wird bei Zeilen mit Artikelnummern und Mengen in einem Bestandsbericht die Zuordnung beibehalten, so dass eine Anwendung für die Bestandsverwaltung die Artikelsummen leicht erhöhen kann.
Unterschriftenerkennung
Amazon Textract erkennt Unterschriften auf jedem Dokument oder Bild. Dadurch werden Unterschriften auf Dokumenten wie Schecks, Kreditanträgen und Antragsformularen ganz einfach automatisch erkannt. Die API-Antwort umfasst die Position der Unterschriften und die zugehörigen Zuverlässigkeitswerte.
Abfragebasierte Extraktion
Amazon Textract bietet Ihnen die Flexibilität, die aus Dokumenten zu extrahierenden Daten mithilfe von Abfragen anzugeben. Sie können die benötigten Informationen in Form von Fragen in natürlicher Sprache angeben (z. B. „Wie lautet der Name des Kunden“) und erhalten die genauen Informationen (z. B. „John Doe“) als Teil der API-Antwort. Sie brauchen die Datenstruktur im Dokument (Tabelle, Formular, implizites Feld, verschachtelte Daten) nicht zu kennen und müssen sich keine Gedanken über Abweichungen zwischen verschiedenen Dokumentversionen und -formaten machen. Textract Queries sind auf eine Vielzahl von Dokumenten trainiert, darunter Gehaltsabrechnungen, Kontoauszüge, W-2-Steuerformulare, Kreditanträge, Hypothekenbriefe, Schadensunterlagen und Versicherungskarten. Dank der Flexibilität von Textract Queries reduziert sich der Bedarf nach Implementierung einer Nachbearbeitung, die Abhängigkeit von manuellen Überprüfungen der extrahierten Daten oder die Notwendigkeit, ML-Modelle zu trainieren.
Handschrifterkennung
Viele Dokumente, wie z. B. medizinische Aufnahmeformulare und Bewerbungen, enthalten sowohl handschriftlichen als auch gedruckten Text. Amazon Textract kann beides aus englischsprachigen Dokumenten mit hoher Konfidenz extrahieren, unabhängig davon, ob der Text frei formuliert oder in Tabellen eingebettet ist. Dokumente können auch eine Mischung aus Drucktext und handgeschriebenem Text enthalten.
Rechnungen und Belege
Rechnungen und Belege können eine große Vielfalt an Layouts aufweisen, was die manuelle Extraktion von Daten in großem Umfang schwierig und zeitaufwändig macht. Amazon Textract nutzt Machine Learning (ML), um den Kontext von Rechnungen und Belegen zu verstehen und extrahiert automatisch relevante Daten wie den Namen des Lieferanten, die Rechnungsnummer, die Artikelpreise, den Gesamtbetrag und die Zahlungsbedingungen.
Ausweisdokumente
Amazon Textract nutzt Machine Learning (ML), um den Kontext von Identitätsdokumenten wie US-Pässen und Führerscheinen zu verstehen, ohne dass Vorlagen oder Konfigurationen erforderlich sind. Sie können automatisch spezifische Informationen wie das Ablaufdatum, das Geburtsdatum extrahieren und darin enthaltene Informationen wie Name und Adresse identifizieren lassen. Mit Analyze ID können Unternehmen, die Dienstleistungen zur Identitätsüberprüfung anbieten, sowie Unternehmen aus dem Finanz-, Gesundheits- und Versicherungswesen auf einfache Weise die Erstellung von Konten, Terminvereinbarungen, Bewerbungen und vieles mehr automatisieren, indem sie ihren Kunden die Möglichkeit geben, ein Bild oder einen Scan ihres Ausweises einzureichen.
Begrenzungsrahmen
Alle extrahierten Daten werden mit Begrenzungsrahmen-Koordinaten zurückgegeben. Hierbei handelt es sich um Polygonrahmen, welche die einzelnen identifizierten Daten umfassen, wie z. B. ein Wort, eine Zeile, eine Tabelle oder einzelne Zellen innerhalb einer Tabelle. Auf diese Weise können Sie überprüfen, woher ein Wort oder eine Zahl im Quelldokument stammt, und Sie können sich orientieren, wenn die Suchergebnisse Scans von Originaldokumenten enthalten. Bei der Suche in Krankenakten nach Details zur Patientengeschichte können Sie beispielsweise das Quelldokument leicht finden und für künftige Suchvorgänge notieren.
Einstellbare Konfidenzschwellenwerte
Bei der Extraktion von Informationen aus Dokumenten gibt Amazon Textract einen Konfidenzwert für alle identifizierten Informationen zurück, damit Sie fundierte Entscheidungen über die Art und Weise der Verwendung dieser Ergebnisse treffen können. Wenn Sie beispielsweise Informationen aus Steuerunterlagen extrahieren und eine hohe Genauigkeit sicherstellen möchten, können Sie jedes Element mit einem Konfidenzwert unter 95 % zur Überprüfung durch einen Menschen kennzeichnen. Für andere Dokumente, bei denen Fehler weniger negative Folgen haben, können Sie einen niedrigeren Schwellenwert festlegen, z. B. bei der Bearbeitung von Lebensläufen oder der Digitalisierung von archivierten Datensätzen.
Integrierter Arbeitsablauf für die Überprüfung durch Menschen
Amazon Textract ist direkt in Amazon Augmented AI (A2I) integriert, sodass Sie für gedruckte und handschriftliche Texte, die aus Dokumenten extrahiert werden, problemlos die Überprüfung durch Menschen implementieren können. Viele Anwendungen für die Textextraktion erfordern eine Überprüfung von Vorhersagen mit geringer Konfidenz durch Menschen, um korrekte Ergebnisse sicherzustellen. Allerdings kann die Erstellung von Systemen für die Überprüfung durch Menschen zeitaufwendig und teuer sein. Amazon A2I bietet integrierte Arbeitsabläufe für die Überprüfung durch Menschen, sodass Sie Vorhersagen einfach überprüfen können. Wählen Sie einen Konfidenzschwellenwert für Ihre Anwendung und alle Vorhersagen mit einer Konfidenz unter dem Schwellenwert werden automatisch an menschliche Prüfer zur Validierung weitergeleitet. Sie können zudem festlegen, welche Schlüssel-Wert-Paare zur Überprüfung durch einen Menschen gesendet werden sollen, und A2I so konfigurieren, dass auch zufällig ausgewählte Dokumente zur Überprüfung gesendet werden. Nutzen Sie einen Pool von Gutachtern innerhalb Ihres Unternehmens oder greifen Sie auf die Arbeitskraft von über 500 000 unabhängigen Auftragnehmern zu, die bereits ML-Aufgaben über Amazon Mechanical Turk durchführen. Sie können auch Personaldienstleister einsetzen, die von AWS vorab auf Qualität und Einhaltung der Sicherheitsverfahren geprüft wurden. Weitere Informationen zur Implementierung von Workflows für die Prüfung durch Menschen finden Sie auf der Website von Amazon A2I und unter Amazon-A2I-Integration mit Amazon Textract im Entwicklerhandbuch.
Preise zu Amazon Textract
Amazon Textract ist ein Machine Learning (ML)-Service, der automatisch Text, Handschrift und Daten aus gescannten Dokumenten extrahiert. Es geht über eine einfache optische Zeichenerkennung (OCR) hinaus, um Daten aus Formularen und Tabellen zu identifizieren, zu verstehen und zu extrahieren. Mit Amazon Textract zahlen Sie nur für das, was Sie tatsächlich nutzen. Es fallen weder Mindestgebühren noch Vorausleistungen an. Amazon Textract berechnet nur die verarbeiteten Seiten, unabhängig davon, ob Sie Text, Text mit Tabellen, Formulardaten, Abfragen oder Rechnungen und Ausweisdokumente verarbeiten. Lesen Sie die Häufig gestellten Fragen für weitere Informationen über die Seiten und die akzeptable Nutzung von Textract.

In Amazon Textract können Sie ohne Vorauszahlungen oder langfristige Verpflichtungen einsteigen.

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent.

Beginnen Sie mit der Entwicklung mit Amazon Textract in der AWS-Managementkonsole.