Amazon SageMaker Catalog propose une classification automatique des données à l'aide d'agents d'IA

Publié le: 30 nov. 2025

Amazon SageMaker Catalog propose désormais une classification automatique des données qui suggère des termes du glossaire métier lors de la publication des données, ce qui réduit les efforts de balisage manuel et améliore la cohérence des métadonnées entre les organisations.

Cette fonctionnalité analyse les métadonnées des tableaux et les informations de schéma à l'aide des modèles de langage d'Amazon Bedrock afin de recommander des termes pertinents à partir des glossaires métiers de l'organisation. Les producteurs de données reçoivent des suggestions générées par l'IA pour les termes commerciaux définis dans leurs glossaires, qui incluent à la fois des termes fonctionnels et des classifications de données sensibles telles que PII et PHI, ce qui facilite le balisage de leurs jeux de données avec un vocabulaire standardisé. Les producteurs peuvent accepter ou modifier ces suggestions avant de les publier, ce qui garantit une terminologie cohérente entre les actifs de données et améliore la visibilité des données pour les utilisateurs professionnels.

La classification automatique des données est disponible dans les régions AWS USA Est (Virginie du Nord, Ohio), USA Ouest (Oregon), Asie-Pacifique (Tokyo, Séoul, Singapour, Sydney, Mumbai) et Europe (Francfort, Irlande, Londres, Paris) où Amazon
SageMaker fonctionne.

Pour commencer, accédez à SageMaker Unified Studio et configurez votre glossaire métier afin de générer des recommandations pour les termes du glossaire métier. Vous pouvez également utiliser l'interface de ligne de commande AWS ou les kits SDK pour gérer par programmation les suggestions de termes du glossaire.
Pour en savoir plus, consultez le Guide de l'utilisateur de SageMaker Catalog.