AWS Glue DataBrew menambahkan kemampuan untuk menentukan statistik kualitas data mana yang dihasilkan untuk kumpulan data Anda

Dikirim di: 23 Jul 2021

AWS Glue DataBrew sekarang memungkinkan pelanggan menentukan statistik kualitas data mana yang akan dibuat secara otomatis untuk kumpulan data saat menjalankan pekerjaan profil. Hal ini memungkinkan pengguna untuk menyesuaikan statistik profil data seperti menentukan nilai duplikat, korelasi, dan outlier berdasarkan sifat dan ukuran kumpulan data mereka, dan membuat ikhtisar profil data khusus hanya dengan statistik yang memenuhi kebutuhan mereka.

DataBrew menampilkan semua statistik dari pekerjaan profil di dasbor profil visual dan menyimpan data mentah sebagai objek JSON di bucket Amazon S3. Pelanggan dapat mengontrol statistik apa yang akan ditampilkan, memantau kualitas data yang masuk dari waktu ke waktu, dan menemukan perubahan data dalam hitungan menit, semuanya tanpa menulis kode apa pun. Pelanggan juga dapat mengatur peringatan kualitas data otomatis menggunakan DataBrew dan AWS Lambda, seperti yang diuraikan dalam posting blog ini.

Untuk memulai, kunjungi AWS Management Console atau instal plugin DataBrew di lingkungan Notebook Anda dan lihat dokumentasi Data Brew.