Amazon Textract

Extrahieren Sie Text und Daten ganz einfach aus praktisch jedem Dokument
Amazon Textract ist ein vollständig verwalteter Machine-Learning-Service, der Text und Daten automatisch aus eingescannten Dokumenten extrahiert. Dieser Vorgang geht über eine einfache optische Zeichenerkennung (Optical Character Recognition, OCR) zum Identifizieren, Verstehen und Extrahieren von Daten aus Formularen und Tabellen hinaus.

Viele Unternehmen extrahieren heute Daten aus eingescannten Dokumenten wie PDF-Dateien, Tabellen und Formularen durch manuelle Texteingaben (langsam, teuer und fehleranfällig) oder durch einfache OCR-Software, die manuell konfiguriert und bei jeder Änderung der Form aktualisiert werden muss, um zu funktionieren.
 
Um diese manuellen Prozesse abzuschaffen, verwendet Textract Machine Learning zum sofortigen Lesen und Verarbeiten beliebiger Dokumenttypen, zum präzisen Extrahieren von Text, Formularen, Tabellen und anderen Daten, ohne dass manuelle Arbeit oder benutzerdefinierter Code erforderlich ist.

Mit Textract können Sie manuelle Dokumentenaktivitäten schnell automatisieren und so Millionen Dokumentenseiten in wenigen Stunden verarbeiten. Nach dem Erfassen der Informationen können Sie diese innerhalb ihrer Geschäftsanwendungen nutzen, um etwa die nächsten Schritte für einen Darlehensantrag, ein Steuerdokument oder ein Registrierungsformular einzuleiten oder Krankenversicherungsansprüche zu verarbeiten. Außerdem können Sie intelligente Suchindizes erstellen oder menschliche Überprüfungen mit Amazon Augmented AI hinzufügen, um nuancierte oder vertrauliche Daten zu überprüfen.

Vorteile

Schnelles und präzises Extrahieren strukturierter und unstrukturierter Daten

Amazon Textract verwendet künstliche Intelligenz, um Dokumente ähnlich wie ein Mensch zu "lesen" und Texte, Tabellen, Formulare sowie andere strukturierte Daten ohne Konfiguration, Training oder benutzerdefinierten Code zu extrahieren. Amazon Textract erkennt automatisch das Layout eines Dokuments und die Schlüsselelemente auf der Seite, versteht die Datenbeziehungen in eingebetteten Formularen oder Tabellen und extrahiert alles mit intaktem Kontext.

Mehr als eine einfache optische Zeichenerkennung (Optical Character Recognition, OCR)

Amazon Textract verwendet OCR-Technologie zum Identifizieren von Formularbeschriftungen und -werten und extrahiert Informationen aus Tabellen, ohne die Struktur zu gefährden – alles zu niedrigen Kosten. Sie zahlen nur für das, was Sie tatsächlich nutzen, und es gibt keine Vorabverpflichtungen oder langfristigen Vertragsbindungen. 

Sicherheit und Compliance

Textract kann für Workloads verwendet werden, die der Service Organization Control (SOC)-Compliance und der International Organization for Standardization (ISO)-Compliance sowie PCI, HIPAA und GPDR unterliegen, was bedeutet, dass Kunden aus dem Finanz- und dem Gesundheitswesen sowie darüber hinaus fundierte Einblicke in die Sicherheitsprozesse und -kontrollen erhalten können, die Kundendaten schützen.

Einfache Implementierung der Überprüfung durch Menschen

Amazon Textract ist direkt in Amazon Augmented AI (Amazon A2I) integriert, sodass Sie für Texte, die aus Dokumenten extrahiert werden, problemlos die Überprüfung durch Menschen implementieren können. Sie können Überprüfungen durch Menschen integrieren, um nuancierte oder vertrauliche Workloads zu verwalten, die menschliches Urteilsvermögen erfordern, um Vorhersagen mit hoher Zuverlässigkeit zu erhalten oder Vorhersagen laufend zu prüfen.

Was ist Amazon Textract (1:49)

Anwendungsfälle

Erstellen Sie intelligente Suchindizes

Extrahieren Sie strukturierte Daten aus Dokumenten und erstellen Sie einen intelligenten Index, mit dem Sie schnell Millionen von Finanzberichten durchsuchen können. Zum Beispiel könnte ein Finanzierungsunternehmen Amazon Textract verwenden, um innerhalb weniger Stunden Millionen von gescannten Darlehensanträgen zu scannen und die extrahierten Daten in Amazon Elasticsearch zu indizieren. So wäre das Unternehmen in der Lage, Suchanfragen wie „Darlehensanträge suchen, bei denen der Name des Antragstellers Max Mustermann lautet“ zu erstellen, oder „Verträge suchen, bei denen der Zinssatz 2 Prozent beträgt“.

Erstellen Sie automatisierte Dokumentenverarbeitungs-Workflows

Amazon Textract kann die erforderlichen Eingaben bereitstellen, um Formulare automatisch und ohne menschliches Zutun zu verarbeiten. Beispielsweise können Banken Kreditanträge mithilfe von Amazon Textract automatisieren. Die in den Dokumenten enthaltenen Informationen könnten verwendet werden, um alle zur Genehmigung des Darlehens erforderlichen Hintergrund- und Kreditwürdigkeitsprüfungen zu initiieren. So können Kunden eine sofortige Entscheidung über ihren Antrag erhalten, statt mehrere Tage bis zum Abschluss der manuellen Prüfung und Validierung warten zu müssen.

Bewahren Sie Compliance in Dokumentarchiven

Da Amazon Textract Datentypen und Formularbeschriftungen automatisch erkennt, lässt sich die Einhaltung von Informationskontrollen leicht wahren. Zum Beispiel könnte ein Versicherungsunternehmen Amazon Textract verwenden, um in einem Workflow vor der Archivierung von Antragsformularen personenbezogene Informationen automatisch zur Prüfung zu schwärzen, indem es die wichtigen, zu schützenden Schlüsselwertpaare automatisch erkennt.

Kundenerfolg

600x400-cambia-health-solutions_logo

Cambia Health Solutions ist ein Komplettanbieter für Gesundheitslösungen und Mutterunternehmen sechs regionaler Krankenversicherer, darunter Regence, ein Versicherungsunternehmen mit 2,6 Millionen Kunden in den Bundesstaaten Oregon, Idaho, Utah und Washington.

„In den letzten hundert Jahren hat sich Cambia für die Verbesserung der Gesundheitswesens für Menschen und ihre Familien eingesetzt. Zur Unterstützung bei der Erreichung dieses Ziels bewerten wir stets neue Innovationen und Gelegenheiten zur Optimierung der Koordination der Gesundheitspflege. Ein Schwerpunktbereich ist die Optimierung zeit- und arbeitsintensiver Verwaltungsvorgänge. Mit großer Aufregung erforschen wir die Möglichkeiten von Amazon Textract zur Hilfe bei der Automatisierung des Vorgangs der genauen und effizienten Extraktion wertvoller Daten aus Papierformularen. Die starke Kombination aus Datenwissenschaft, K.I. und einem personenbezogenen Ansatz ist für unsere Mission zur Verwandlung des Gesundheitssystems entscheidend.“

Faraz Shafiq, Chief Artificial Intelligence Officer - Cambia Health Solutions


Change Healthcare_red_blue_logo_CMYK-01

Change Healthcare ist eine führende unabhängige Gesundheitstechnikfirma, die zur Verbesserung klinischer, finanzieller und patientenengagementbezogener Ergebnisse im US-Gesundheitssystem Daten und analysegetriebene Lösungen anbietet.

„Bei Change Healthcare glauben wir daran, dass wir das Gesundheitswesen für alle bezahlbar und zugänglich gestalten können, indem wir die Zeitrahmen und Qualität von Finanz- und Verwaltungsentscheidungen verbessern. Dies kann durch die Kraft der Machine Learning-Technologie zwecks besseren Verständnisses unserer Daten bewerkstelligt werden. Doch die Freisetzung des Potentials dieser Informationen ist oft schwierig, da sie in Tabellen und Formularen gespeichert sind, die von herkömmlicher optischer Schrifterkennung nicht analysiert werden können. Amazon Textract fördert mit seiner Fähigkeit zur Extraktion strukturierter Daten zusätzlich zu Text das Verständnis von Dokumenten, und da der Service nun HIPPA-konform wird, können wir die Informationen aus Millionen von Dokumenten befreien und für Patienten, Zahler und Anbieter noch mehr Wert schöpfen.“

Nick Giannasi, EVP and Chief AI Officer - Change Healthcare


CD_2018_Primary_Logo_w_TM

ClearDATAs innovative Lösungs- und Serviceplattform schützt Kunden vor Datensicherheitsrisiken, verbessert ihr Datenmanagement und skaliert ihre Gesundheitswesen-IT-Infrastruktur, so dass es der Branche möglich ist, sich durch Verbesserung der täglichen Erbringung von Gesundheitsdienstleistungen an jedem Tag aufs Neue auf die Verbesserung des Gesundheitswesens zu konzentrieren.

„Es ist aufregend, zu verfolgen, wie AWS ihren von Machine Learning unterstützten optischen Schrifterkennungsservice Textract in seine Liste HIPAA-geeigneter Services aufnimmt. Viele zwischen Zahlern und Anbietern ausgetauschte Daten sind in bildbasierten Dateien wie PDFs gefangen. Statt diese Art Daten manuell zu bearbeiten, können Gesundheitsorganisationen nun den Amazon Textract-Service zur Extraktion medizinischer Daten aus Dateien nutzen, die zuvor nicht maschinell lesbar waren. Das schafft die Gelegenheit, diese Daten mit ihren elektronischen Gesundheitsaufzeichnungen oder anderen Cloud-Technologien wie Amazon Comprehend Medical zu integrieren, die geschützte Gesundheitsinformationen im Datensatz erkennen können. Das ist ein weiterer Schritt vorwärts bei der Verbesserung der Gelegenheit zur Nutzung dieser sich entwickelnden Technologien, um den Zugang zu Daten zu verbessern, bessere Einblicke zu gewinnen und die Erfahrung von Patienten und Mitgliedern zu verbessern.“

Matt Ferrari, Chief Technology Officer - ClearDATA

Product-Page_Standard-Icons_01_Product-Features_SqInk
Sehen Sie sich die Merkmale von Amazon Textract an

Entdecken Sie weitere Amazon Textract-Funktionen

Weitere Informationen 
Product-Page_Standard-Icons_02_Sign-Up_SqInk
Registrieren Sie sich und erhalten Sie ein kostenloses Konto

Sie erhalten sofort Zugriff auf das kostenlose AWS-Kontingent. 

Registrieren 
Product-Page_Standard-Icons_03_Start-Building_SqInk
Beginnen Sie mit der Entwicklung in der Konsole

Beginnen Sie mit der Entwicklung mit Amazon Textract in der AWS-Managementkonsole.

Registrieren