Veröffentlicht am: Aug 3, 2022

Amazon Comprehend macht es Kunden leichter, mit der Erkennung benutzerdefinierter Entitäten zu starten, indem die Annotationsanforderungen zum Trainieren ihrer Modelle gesenkt wird. Amazon Comprehend ist ein natürlicher Sprachverarbeitungsservice (NLP), der APIs bereitstellt, um Schlüsselphrasen, kontextabhängige Entitäten, Ereignisse und Stimmung aus Text zu extrahieren. Entitäten beziehen sich auf Dinge in Ihrem Dokument, wie etwa Personen, Orte, Organisationen, Kreditkartennummern und so weiter. Die benutzerdefinierte Entitätserkennung (CER) in Amazon Comprehend ermöglicht Ihnen das Trainieren von Modellen mit für Ihr Unternehmen einzigartigen Entitäten in nur wenigen einfachen Schritten. Sie können fast jede Art von Entität identifizieren, indem Sie einfach eine ausreichende Anzahl an Details zum effektiven Trainieren Ihres Modells angeben.

Bis heute mussten Sie einen Erkenner von benutzerdefinierten Entitäten in Amazon Comprehend mit mindestens 250 Dokumenten und 100 Annotationen pro Entität trainieren. Ab heute reduzieren wir die Mindestanforderungen zum Trainieren eines Modells für die Erkennung benutzerdefinierter Entitäten in Amazon Comprehend auf 25 Annotationen pro Entitätstyp. Mit unserer verbesserten Modellierung im Hintergrund können Sie Ihre Experimente nun schon mit nur 3 annotierten Dokumenten ausführen, die Vorabergebnisse analysieren und mithilfe zusätzlicher Annotationen und Dokumente iterieren. Die reduzierten Limits gelten für die Modelle zur Erkennung von benutzerdefinierten Entitäten ausschließlich in Textdokumenten.

Weitere Informationen für den Einstieg finden Sie im Launch-Blogbeitrag, auf der Produktseite oder in unserer Dokumentation.