AWS Glue DataBrew aggiunge la possibilità di specificare quali statistiche sulla qualità dei dati vengono generate per i tuoi set di dati
AWS Glue DataBrew ora consente ai clienti di specificare quali statistiche sulla qualità dei dati generare automaticamente per i set di dati durante l'esecuzione di un processo di profilo. Ciò consente agli utenti di personalizzare le statistiche del profilo di dati, ad esempio determinando valori duplicati, correlazioni e valori anomali in base alla natura e alle dimensioni dei propri set di dati e creare una panoramica personalizzata del profilo di dati con solo le statistiche che soddisfano le loro esigenze.
DataBrew mostra tutte le statistiche di un job di profilo su una dashboard di profilo visivo e archivia i dati grezzi come oggetto JSON in un bucket Amazon S3. I clienti possono controllare quali statistiche mostrare, monitorare la qualità dei dati in entrata nel tempo e scoprire le modifiche ai dati in pochi minuti, il tutto senza scrivere alcun codice. I clienti possono anche impostare avvisi automatici sulla qualità dei dati utilizzando DataBrew e AWS Lambda, come descritto in questo post del blog.
Per iniziare, visita la Console di gestione AWS o installa il plug-in DataBrew nel tuo ambiente Notebook e consulta la documentazione DataBrew.