AWS Glue DataBrew เพิ่มความสามารถในการระบุสถิติคุณภาพข้อมูลที่สร้างขึ้นสำหรับชุดข้อมูลของคุณ
AWS Glue DataBrew ช่วยให้ลูกค้าสามารถระบุสถิติคุณภาพข้อมูลที่จะสร้างอัตโนมัติสำหรับชุดข้อมูลเมื่อเรียกใช้งานโปรไฟล์ สิ่งนี้ช่วยให้ผู้ใช้สามารถปรับแต่งสถิติโปรไฟล์ข้อมูล เช่น การกำหนดค่าที่ซ้ำกัน ความสัมพันธ์ และค่าแยกต่างตามลักษณะและขนาดของชุดข้อมูล และสร้างภาพรวมโปรไฟล์ข้อมูลที่กำหนดเองด้วยสถิติที่ตรงตามความต้องการเท่านั้น
DataBrew จะแสดงสถิติทั้งหมดจากงานโปรไฟล์บนแดชบอร์ดโปรไฟล์ภาพและจัดเก็บข้อมูลดิบเป็นวัตถุ JSON ในถัง Amazon S3 ลูกค้าสามารถควบคุมสถิติที่จะแสดง ตรวจสอบคุณภาพของข้อมูลขาเข้าตลอดเวลา และค้นพบการเปลี่ยนแปลงของข้อมูลภายในไม่กี่นาที ทั้งหมดนี้โดยไม่ต้องเขียนโค้ดใด ๆ ลูกค้ายังสามารถตั้งค่าการแจ้งเตือนคุณภาพข้อมูลอัตโนมัติโดยใช้ DataBrew และ AWS Lambda ตามที่ระบุไว้ในโพสต์บล็อก นี้
ในการเริ่มต้น ให้ไปที่ คอนโซลการจัดการ AWS หรือติดตั้ง ปลั๊กอิน DataBrew ในสภาพแวดล้อมโน้ตบุ๊คของคุณ และอ้างอิงเอกสารของ Data Brew