ประกาศการปรับปรุงภาษานิยามคุณภาพข้อมูล (DQDL) สำหรับการตรวจคุณภาพข้อมูลของ AWS Glue

โพสต์บน: 28 มิ.ย. 2024

ลูกค้าใช้การตรวจคุณภาพข้อมูลของ AWS Glue ซึ่งเป็นฟีเจอร์ของ AWS Glue เพื่อวัดและตรวจสอบคุณภาพของข้อมูล ลูกค้าสร้างกฎคุณภาพข้อมูลโดยใช้ DQDL เพื่อให้แน่ใจว่าข้อมูลของตนถูกต้อง ลูกค้าจำเป็นต้องมีความสามารถในการสร้างกฎสำหรับสถานการณ์ทางธุรกิจที่ซับซ้อน ซึ่งรวมถึงเงื่อนไขตัวกรอง เงื่อนไขการยกเว้น การตรวจสอบค่าว่าง และกฎแบบรวม ก่อนหน้านี้ลูกค้าต้องสร้าง SQL เพื่อดำเนินการตรวจสอบคุณภาพข้อมูลเหล่านี้ในกฎประเภท CustomSQL วันนี้ AWS Glue ประกาศรายการปรับปรุงใหม่ๆ สำหรับ DQDL ที่จะช่วยให้วิศวกรข้อมูลสามารถสร้างกฎคุณภาพข้อมูลที่ซับซ้อนได้อย่างง่ายดายโดยใช้กฎประเภทเนทีฟ ตอนนี้ DQDL รองรับ

  • ตัวดำเนินการ NOT ซึ่งช่วยให้ลูกค้ายกเว้นค่าบางอย่างในกฎของตนได้
  • คีย์เวิร์ดใหม่ เช่น NULL, EMPTY และ WHITESPACES_ONLY เพื่อสร้างกฎที่ระบุค่าที่หายไปโดยไม่ต้องอาศัยรูปแบบอักขระที่ซับซ้อน
  • กฎแบบรวมเพื่อให้ลูกค้าสร้างกฎธุรกิจที่ซับซ้อนได้ ตอนนี้ลูกค้าสามารถระบุตัวเลือกเพื่อจัดการลำดับการประเมินของกฎเหล่านี้ได้แล้ว
  • ข้อความ WHERE ใน DQDL เพื่อกรองข้อมูลก่อนที่จะใช้กฎ

ดูข้อมูลเพิ่มเติมได้ที่คู่มือ DQDL

การตรวจคุณภาพข้อมูลของ AWS Glue พร้อมให้ใช้งานในรีเจี้ยนเชิงพาณิชย์ทุกแห่งที่มี AWS Glue ให้บริการ ดูข้อมูลเพิ่มเติมได้ที่หน้าผลิตภัณฑ์ AWS Glue และเอกสารประกอบของเรา