Hadirkan data berkualitas tinggi di seluruh danau data dan alur Anda
Ratusan ribu pelanggan membangun danau data, yang dapat menjadi rawa data tanpa kualitas data. Menyiapkan kualitas data adalah proses yang memakan banyak waktu dan membosankan. Anda harus secara manual menganalisis dan membuat aturan kualitas data serta menulis kode untuk memberi tahu saat kualitas memburuk. AWS Glue Data Quality mengurangi upaya manual terkait kualitas dari hitungan hari menjadi jam. AWS Glue Data Quality secara otomatis mengomputasi statistik, merekomendasikan aturan kualitas, memantau, dan memberi tahu saat kualitas memburuk. Oleh karena itu, mengidentifikasi data yang hilang, kedaluwarsa, atau berkualitas buruk sebelum berdampak pada bisnis Anda menjadi sebuah proses yang efisien.
Fitur utama
Rekomendasi aturan otomatis yang dikostumisasi untuk data Anda
Memulai dengan kualitas data dapat menyulitkan karena Anda harus secara manual menganalisis data untuk membuat aturan kualitas. AWS Glue Data Quality secara otomatis mengomputasi statistik untuk set data Anda. AWS Glue Data Quality menggunakan statistik tersebut untuk merekomendasikan serangkaian aturan kualitas yang memeriksa kebaruan, akurasi, dan integritas. Anda dapat menyesuaikan aturan yang direkomendasikan, membuang aturan, atau menambahkan aturan baru sesuai kebutuhan. Saat mendeteksi adanya masalah terkait kualitas, AWS Glue Data Quality juga akan memberitahukannya, sehingga Anda dapat segera bertindak.
Dapatkan kualitas data diam dan kualitas data dalam pipeline.
Data Anda diam di repositori yang berbeda dan berpindah dari satu repositori ke repositori lainnya. Memantau kualitas data saat data tersebut masuk atau saat bergerak sangatlah penting untuk dilakukan. Aturan Kualitas Data AWS Glue dapat diterapkan ke data diam dalam set data dan danau data Anda, serta ke seluruh alur data tempat data bergerak. Anda dapat menerapkan aturan di beberapa set data. Untuk alur data yang dibangun di AWS Glue Studio, Anda dapat menerapkan transformasi untuk mengevaluasi kualitas seluruh alur. Anda juga dapat menentukan aturan untuk menghentikan pipeline jika kualitasnya memburuk dan mencegah data yang buruk agar tidak masuk ke danau data Anda.
Kualitas data nirserver yang hemat biaya dan berskala petabita tanpa penguncian
AWS Glue bersifat nirserver, sehingga Anda dapat menskalakan tanpa harus mengelola infrastruktur. AWS Glue menskalakan berbagai ukuran data dan menghadirkan penagihan sesuai pemakaian untuk meningkatkan ketangkasan dan memperbaiki biaya. AWS Glue Data Quality menggunakan Deequ, sebuah kerangka kerja sumber terbuka yang dibangun oleh Amazon dan digunakan untuk mengelola set data berskala petabita. Karena dibuat menggunakan sumber terbuka, Kualitas Data AWS Glue dapat memberikan fleksibiltas dan portabilitas tanpa penguncian.
Pahami dan perbaiki masalah kualitas data
Ketika masalah kualitas data terjadi, Anda dapat menggunakan Kualitas Data AWS Glue untuk menelusuri data Anda guna mengevaluasi dan memperbaiki masalah ini. Anda dapat menggunakan wawasan kualitas data ini untuk menerapkan aturan dan proses baru guna meningkatkan data Anda di masa mendatang.