การตรวจคุณภาพข้อมูลของ AWS Glue รองรับการสอบถามการประมวลผลล่วงหน้า
วันนี้ AWS ประกาศความพร้อมใช้งานทั่วไปของคำสั่งสืบค้นการประมวลผลล่วงหน้าสำหรับการตรวจคุณภาพข้อมูลของ AWS Glue ซึ่งช่วยให้คุณสามารถแปลงข้อมูลของคุณก่อนดำเนินการตรวจสอบคุณภาพข้อมูลผ่าน API แค็ตตาล็อกข้อมูลของ AWS Glue ฟีเจอร์นี้ช่วยให้คุณสามารถสร้างคอลัมน์ที่ได้มากรองข้อมูลตามเงื่อนไขเฉพาะดำเนินการคำนวณและตรวจสอบความสัมพันธ์ระหว่าง
คอลัมน์โดยตรงภายในกระบวนการประเมินคุณภาพข้อมูลของคุณ
คำสั่งสืบค้นการประมวลผลล่วงหน้าให้ความยืดหยุ่นที่เพิ่มขึ้นสำหรับสถานการณ์คุณภาพข้อมูลที่ซับซ้อนซึ่งต้องมีการเปลี่ยนแปลงข้อมูลก่อนการตรวจสอบ คุณสามารถสร้างเมตริกที่ได้มาเช่นการคำนวณค่าธรรมเนียมรวมจากคอลัมน์ภาษีและการจัดส่ง จำกัดจำนวนคอลัมน์ที่พิจารณาสำหรับคำแนะนำคุณภาพข้อมูล หรือกรองชุดข้อมูลเพื่อมุ่งเน้นการตรวจสอบคุณภาพในชุดย่อยข้อมูลเฉพาะ ความสามารถนี้ไม่จำเป็นต้องใช้ขั้นตอนการประมวลผลข้อมูลล่วงหน้าแยกต่างหาก ทำให้เวิร์กโฟลว์การทำงานคุณภาพของข้อมูลของคุณคล่องตัว
คำสั่งสืบค้นการตรวจคุณภาพข้อมูลของ AWS Glue สามารถใช้ได้ผ่าน API ของแค็ตตาล็อกข้อมูลของ AWS Glue ได้แก่ start-data-quality-rule-recommendation-run และ start-data-quality-ruleset-evaluation-run ใน AWS Region เชิงพาณิชย์ทั้งหมดที่มีการตรวจคุณภาพข้อมูลของ AWS Glue หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับคำสั่งสืบค้นการประมวลผลล่วงหน้า โปรดดู เอกสารการตรวจคุณภาพข้อมูลของ Glue