Amazon SageMaker Catalog introduce la ricerca avanzata di identificatori tecnici in SageMaker Unified Studio

Inserito il: 9 apr 2025

Amazon SageMaker Catalog, parte della nuova generazione di Amazon SageMaker, ora supporta funzionalità di ricerca avanzate con corrispondenza esatta e parziale per identificatori tecnici come nomi di colonne e tabelle. Questa funzionalità consente agli utenti di effettuare ricerche precise racchiudendo i termini tra virgolette doppie (" "), aiutandoli a individuare rapidamente le risorse con nomi tecnici esatti o parziali. Ad esempio, gli analisti possono trovare colonne specifiche più rapidamente, i data steward possono convalidare le risorse grazie a modelli di denominazione come "audit_" e gli ingegneri possono individuare tabelle temporanee con prefissi come "temp_".

Basato sulle funzionalità di ricerca semantica e per parole chiave già presenti in SageMaker Catalog, questo miglioramento è pensato per le organizzazioni che gestiscono cataloghi di dati su larga scala con convenzioni di denominazione complesse. Ad esempio, la ricerca di "customer_id" restituisce solo le risorse con corrispondenza esatta, mentre "sales_" individua risorse come sales_summary e sales_data_2024. Queste funzionalità aiutano gli utenti a individuare rapidamente le risorse tecniche, a migliorare la governance dei dati riducendo gli errori e a favorire una migliore collaborazione tra i team.

Consulta la documentazione del prodotto per scoprire come configurare le regole dei metadati per i flussi di lavoro di sottoscrizione e pubblicazione.