Veröffentlicht am: Sep 28, 2023
Amazon Textract ist ein Machine-Learning-Service, der automatisch gedruckten Text, Handschrift und Daten aus Dokumenten oder Bildern extrahiert. Heute freuen wir uns, Layout anzukündigen, eine neue Amazon-Textract-Funktion, mit der Kunden Layout-Elemente wie Absätze, Titel, Listen, Kopf- und Fußzeilen und mehr aus Dokumenten extrahieren können. Layout wird ein neuer Feature-Typ in der Analyze-Document-API sein. Kunden können Layout als eigenständiges Feature oder in Kombination mit anderen Feature-Typen zum Analysieren von Dokumenten verwenden.
Layout wurde anhand einer Vielzahl von Dokumenten aus den Bereichen Finanzdienstleistungen, Recht, Versicherungen, Medizin, Medien und anderen Branchen vorab trainiert. Mit Layout können Kunden Layout-Elemente direkt aus Dokumenten extrahieren und sind nicht mehr auf die Entwicklung und Pflege komplexer Nachbearbeitungscodes angewiesen. Wir erwarten, dass Layout die Effizienz von Dokumentenverarbeitungsvorgängen wie die Erstellung von Suchindizes, Einbettungen für Retrieval Augmented Generation (RAG)-Anwendungen und vieles mehr verbessern wird.
Dieses Feature wird ab dem 29. September in USA Ost (Ohio, Nordvirginia), USA West (Nordkalifornien), USA West (Oregon), Asien-Pazifik (Mumbai, Seoul, Singapur, Sydney), Kanada (Zentral), Europa (Frankfurt, Irland, London, Paris) und AWS GovCloud (US-Ost, US-West) verfügbar sein.
Um zu beginnen, melden Sie sich in der Amazon-Textract-Konsole an und probieren Sie das neue Feature aus. Um mehr über die Möglichkeiten von Textract zu erfahren, besuchen Sie die Amazon-Textract-Website, das Entwicklerhandbuch oder die Ressourcen-Seite.