Amazon SageMaker Catalog introduce la ricerca avanzata di identificatori tecnici in SageMaker Unified Studio
Amazon SageMaker Catalog, parte della nuova generazione di Amazon SageMaker, ora supporta funzionalità di ricerca avanzate con corrispondenza esatta e parziale per identificatori tecnici come nomi di colonne e tabelle. Questa funzionalità consente agli utenti di effettuare ricerche precise racchiudendo i termini tra virgolette doppie (" "), aiutandoli a individuare rapidamente le risorse con nomi tecnici esatti o parziali. Ad esempio, gli analisti possono trovare colonne specifiche più rapidamente, i data steward possono convalidare le risorse grazie a modelli di denominazione come "audit_" e gli ingegneri possono individuare tabelle temporanee con prefissi come "temp_".
Basato sulle funzionalità di ricerca semantica e per parole chiave già presenti in SageMaker Catalog, questo miglioramento è pensato per le organizzazioni che gestiscono cataloghi di dati su larga scala con convenzioni di denominazione complesse. Ad esempio, la ricerca di "customer_id" restituisce solo le risorse con corrispondenza esatta, mentre "sales_" individua risorse come sales_summary e sales_data_2024. Queste funzionalità aiutano gli utenti a individuare rapidamente le risorse tecniche, a migliorare la governance dei dati riducendo gli errori e a favorire una migliore collaborazione tra i team.
Consulta la documentazione del prodotto per scoprire come configurare le regole dei metadati per i flussi di lavoro di sottoscrizione e pubblicazione.