Amazon SageMaker Catalog ajoute une recherche précise par identifiant technique dans SageMaker Unified Studio
Le catalogue Amazon SageMaker, qui fait partie de la prochaine génération d'Amazon SageMaker, prend désormais en charge des fonctionnalités de recherche améliorées avec des fonctionnalités de correspondance exacte et partielle pour les identifiants techniques tels que les noms de colonnes et de tableaux. Cette fonctionnalité permet aux utilisateurs d'effectuer des recherches précises en insérant des termes dans un qualificatif, tel que des guillemets doubles (« »), ce qui les aide à localiser rapidement les actifs dont les noms techniques sont exacts ou partiels. Par exemple, les analystes peuvent trouver des colonnes spécifiques plus rapidement, les administrateurs peuvent valider les actifs à l'aide de modèles de dénomination tels que « audit_ », et les ingénieurs peuvent identifier les tableaux temporaires avec des préfixes tels que « temp_ ».
S'appuyant sur la recherche sémantique et par mot-clé existante de SageMaker Catalog, cette amélioration est conçue pour les organisations qui gèrent des catalogues de données à grande échelle avec des conventions de dénomination complexes. Par exemple, la recherche de « customer_id » renvoie uniquement les actifs correspondant exactement, tandis qu'une requête telle que « sales_ » renvoie des actifs tels que sales_summary et sales_data_2024. Ces fonctionnalités aident les utilisateurs à localiser rapidement les actifs techniques, à améliorer la gouvernance des données en réduisant les erreurs et à améliorer la collaboration.
Consultez la documentation du produit pour en savoir plus sur la configuration des règles de métadonnées pour les flux de travail d'abonnement et de publication.