يضيف AWS Glue DataBrew القدرة على تحديد إحصاءات جودة البيانات التي يتم إنشاؤها لمجموعات البيانات الخاصة بك

:تاريخ النشر 23 يوليو 2021

تتيح AWS Glue DataBrew الآن للعملاء تحديد إحصاءات جودة البيانات التي سيتم إنشاؤها تلقائيًا لمجموعات البيانات عند تشغيل مهمة الملف الشخصي. يتيح ذلك للمستخدمين تخصيص إحصائيات ملف تعريف البيانات مثل تحديد القيم المكررة والارتباطات والقيم المتطرفة بناءً على طبيعة وحجم مجموعات البيانات الخاصة بهم، وإنشاء نظرة عامة مخصصة لملف تعريف البيانات مع الإحصاءات التي تلبي احتياجاتهم فقط.

تقوم DataBrew بعرض جميع الإحصائيات من مهمة الملف الشخصي على لوحة معلومات ملف التعريف المرئي وتخزين البيانات الأولية ككائن JSON في مجموعة Amazon S3. يمكن للعملاء التحكم في الإحصاءات التي سيتم عرضها، ومراقبة جودة البيانات الواردة بمرور الوقت، واكتشاف التغييرات على البيانات في غضون دقائق، كل ذلك دون كتابة أي رمز. يمكن للعملاء أيضًا إعداد تنبيهات جودة البيانات الآلية باستخدام DataBrew و AWS Lambda، كما هو موضح في منشور المدونة هذا.

للبدء، قم بزيارة وحدة تحكم إدارة AWS أو قم بتثبيت المكون الإضافي DataBrew في بيئة دفتر الملاحظات الخاص بك وراجع وثائق DataBrew.