Trainieren benutzerdefinierter Entitätserkennungsmodelle mit weniger Trainingsdokumenten mit Amazon Comprehend

Veröffentlicht am: Aug 9, 2021

Amazon Comprehend ist ein Service zur Verarbeitung natürlicher Sprache (NLP), der Machine Learning nutzt, um Textdokumente zu analysieren und Erkenntnisse wie Stimmungen, Entitäten und Themen im Text zu identifizieren. Heute aktualisieren wir unsere benutzerdefinierten Entitätserkennungsmodelle, damit Sie Modelle mit weniger Trainingsdokumenten trainieren können. Die benutzerdefinierte Entitätserkennung erweitert die Funktionen von Amazon Comprehend, indem Sie neue Entitätstypen identifizieren können, die nicht als einer der voreingestellten generischen Entitätstypen unterstützt werden. Das bedeutet, dass Sie nicht nur die Entitätstypen aus der Detect-Entities-API wie LOCATION oder DATE, PERSON identifizieren, sondern auch Dokumente analysieren und Entitäten wie PRODUCT_CODE, EMPLOYEE_ID, CONTRACTOR_NAME oder geschäftsspezifische Entitäten extrahieren können, die Sie definieren und die Ihren speziellen Anforderungen entsprechen. Ab heute haben wir die minimal erforderlichen Trainingsdokumente um 50 % reduziert. Das heißt, Sie können benutzerdefinierte Modelle mit nur 100 Anmerkungen pro Entitätstyp aus 250 Dokumenten trainieren. Wenn Sie mehr Trainingsdokumente haben, können Sie von den neueren Modellen sogar bessere Ergebnisse als bisher erwarten!

Die aktualisierten benutzerdefinierten Entitätserkennungsmodelle sind in allen AWS-Regionen verfügbar, in denen Amazon Comprehend verfügbar ist. Um diese neue Funktion auszuprobieren, melden Sie sich in Ihrer Amazon-Comprehend-Konsole an, für eine code-freie Erfahrung, oder laden Sie das AWS-SDK herunter. Weitere Informationen zu dieser neuen Funktion finden Sie in unserem Blog.

Trainieren benutzerdefinierter Entitätserkennungsmodelle mit weniger Trainingsdokumenten mit Amazon Comprehend

Ende des Supports für Internet Explorer