AWS Glue Data Quality (Pratinjau)

Hadirkan data berkualitas tinggi di seluruh danau data dan pipeline Anda

Ratusan ribu pelanggan membangun danau data, yang dapat menjadi data swamp yang tidak berkualitas. Menyiapkan kualitas data adalah proses yang memakan banyak waktu dan membosankan. Anda harus secara manual menganalisis dan membuat aturan kualitas data serta menulis kode untuk memberi tahu saat kualitas memburuk. AWS Glue Data Quality mengurangi upaya manual terkait kualitas dari hitungan hari menjadi jam. AWS Glue Data Quality secara otomatis mengomputasi statistik, merekomendasikan aturan kualitas, memantau, dan memberi tahu saat kualitas memburuk. Oleh karena itu, mengidentifikasi data yang hilang, kedaluwarsa, atau berkualitas buruk sebelum berdampak pada bisnis Anda menjadi sebuah proses yang efisien.

Memperkenalkan AWS Glue Data Quality (0:29)

Fitur utama

Rekomendasi aturan otomatis yang dikostumisasi untuk data Anda

Memulai dengan kualitas data dapat menyulitkan karena Anda harus secara manual menganalisis data untuk membuat aturan kualitas. AWS Glue Data Quality secara otomatis mengomputasi statistik untuk set data Anda. AWS Glue Data Quality menggunakan statistik tersebut untuk merekomendasikan serangkaian aturan kualitas yang memeriksa kebaruan, akurasi, dan integritas. Anda dapat menyesuaikan aturan yang direkomendasikan, membuang aturan, atau menambahkan aturan baru sesuai kebutuhan. Saat mendeteksi adanya masalah terkait kualitas, AWS Glue Data Quality juga akan memberitahukannya, sehingga Anda dapat segera bertindak.

Dapatkan kualitas data diam dan kualitas data dalam pipeline.

Data Anda diam di repositori yang berbeda dan berpindah dari satu repositori ke repositori lainnya. Memantau kualitas data saat data tersebut masuk atau saat bergerak sangatlah penting untuk dilakukan. Aturan AWS Glue Data Quality dapat diterapkan ke data diam pada set data dan danau data Anda, serta ke seluruh pipeline data tempat data bergerak. Untuk pipeline data yang dibangun di AWS Glue Studio, Anda dapat menerapkan transformasi untuk mengevaluasi kualitas seluruh pipeline. Anda juga dapat menentukan aturan untuk menghentikan pipeline jika kualitasnya memburuk dan mencegah data yang buruk agar tidak masuk ke danau data Anda.

Kualitas data nirserver yang hemat biaya dan berskala petabita tanpa penguncian

AWS Glue bersifat nirserver, sehingga Anda dapat menskalakan tanpa harus mengelola infrastruktur. AWS Glue menskalakan berbagai ukuran data dan menghadirkan penagihan sesuai pemakaian untuk meningkatkan ketangkasan dan memperbaiki biaya. AWS Glue Data Quality menggunakan Deequ, sebuah kerangka kerja sumber terbuka yang dibangun oleh Amazon dan digunakan untuk mengelola set data berskala petabita. Karena dibangun menggunakan sumber terbuka, AWS Glue Data Quality dapat memberikan fleksibiltas dan portabilitas tanpa penguncian.