Amazon SageMaker Unified Studio ora supporta la creazione e la valutazione delle regole di qualità dei dati
Amazon SageMaker Unified Studio ora supporta la creazione e la valutazione delle regole di qualità dei dati, con tecnologia Qualità dei dati di AWS Glue. Gli ingegneri dei dati, gli analisti e i data scientist possono definire regole di qualità dei dati, eseguire valutazioni dei set di regole e visualizzare i risultati direttamente all'interno di SageMaker Unified Studio, sia per i dati a riposo nelle tabelle di catalogo che per i dati in transito all'interno dei job ETL visivo. Questo consente di individuare i problemi di qualità dei dati prima che dati non validi entrino nei data lake o influiscano sui carichi di lavoro di analisi e machine learning a valle.
Grazie a questo lancio, è possibile creare regole utilizzando lo stesso Data Quality Definition Language (DQDL) utilizzato in Qualità dei dati di AWS Glue ed eseguire valutazioni direttamente in SageMaker Unified Studio attraverso due flussi di lavoro. Per i dati a riposo, una scheda dedicata alla qualità dei dati sulle risorse del catalogo fornisce funzionalità di creazione delle regole, valutazioni su richiesta o pianificate e risultati dettagliati di superamento/fallimento per ogni regola. Per i dati in transito, è possibile aggiungere una trasformazione Evaluate Data Quality a qualsiasi job ETL visivo e rivedere i risultati della qualità dei dati all'interno dei dettagli dell'esecuzione. È possibile creare set di regole per verificare la completezza, l'unicità, l'aggiornamento, l'accuratezza e altre dimensioni della qualità dei dati.
Questa funzionalità è disponibile in tutte le regioni AWS in cui è disponibile Amazon SageMaker Unified Studio, sia nei domini basati su Centro identità AWS IAM che in quelli basati su IAM. Per ulteriori informazioni, consulta la documentazione di Amazon SageMaker Unified Studio.