Der Amazon-SageMaker-Katalog bietet automatische Datenklassifizierung mithilfe von KI-Agenten

Veröffentlicht am: 30. Nov. 2025

Amazon SageMaker Catalog bietet jetzt eine automatisierte Datenklassifizierung, die bei der Datenveröffentlichung Begriffe aus dem Geschäftsglossar vorschlägt. Dadurch wird der Aufwand für das manuelle Taggen reduziert und die Konsistenz der Metadaten in allen Organisationen verbessert.

Diese Funktion analysiert Tabellenmetadaten und Schemainformationen mithilfe der Sprachmodelle von Amazon Bedrock, um relevante Begriffe aus Unternehmensglossaren zu empfehlen. Datenproduzenten erhalten KI-generierte Vorschläge für Geschäftsbegriffe, die in den Glossaren definiert sind. Dazu gehören sowohl funktionale Begriffe als auch Klassifizierungen sensibler Daten wie PII und PHI, sodass sich ihre Datensätze mit standardisiertem Vokabular einfach kennzeichnen lassen. Hersteller können diese Vorschläge vor der Veröffentlichung akzeptieren oder ändern, wodurch für eine konsistente Terminologie für alle Datenbestände gesorgt und die Auffindbarkeit der Daten für Geschäftsanwender verbessert wird.

Die automatische Datenklassifizierung ist in den AWS-Regionen USA Ost (Nord-Virginia, Ohio), USA West (Oregon), Asien-Pazifik (Tokio, Seoul, Singapur, Sydney, Mumbai) und Europa (Frankfurt, Irland, London, Paris) verfügbar, in denen Amazon
SageMaker betrieben wird.

Rufen Sie zunächst SageMaker Unified Studio auf, um Ihr Geschäftsglossar so zu konfigurieren, dass Empfehlungen für Begriffe aus dem Geschäftsglossar generiert werden. Sie können auch die AWS-CLI oder SDKs nutzen, um Vorschläge für Glossarbegriffe programmgesteuert zu verwalten.
Weitere Informationen finden Sie im SageMaker-Katalog-Benutzerhandbuch.