เลือกค่ากำหนดคุกกี้ของคุณ

เราใช้คุกกี้ที่จำเป็นและเครื่องมือที่คล้ายคลึงกันซึ่งจำเป็นในการให้บริการเว็บไซต์และบริการต่างๆ ของเรา เราใช้คุกกี้ประสิทธิภาพเพื่อรวบรวมสถิติที่ไม่ระบุชื่อ เพื่อให้เราเข้าใจว่าลูกค้าใช้เว็บไซต์ของเราอย่างไร และทำการปรับปรุง คุณไม่สามารถปิดใช้งานคุกกี้ที่จำเป็นได้ แต่คุณสามารถคลิก “ปรับแต่ง” หรือ “ปฏิเสธ” เพื่อปฏิเสธคุกกี้ประสิทธิภาพ

หากคุณยอมรับ AWS และบุคคลที่สามที่ได้รับการอนุมัติจะใช้คุกกี้เพื่อมอบคุณสมบัติของเว็บไซต์ที่มีประโยชน์ จดจำการตั้งค่าของคุณ และแสดงเนื้อหาที่เกี่ยวข้อง รวมถึงการโฆษณาที่เกี่ยวข้อง หากต้องการยอมรับหรือปฏิเสธคุ้กกี้ที่ไมจำเป็นทั้งหมด คลิก “ยอมรับ” หรือ “ปฏิเสธ” หากต้องการตัดสินใจโดยละเอียด โปรดคลิก “ปรับแต่ง”

ตอนนี้แค็ตตาล็อกข้อมูลของ AWS Glue รองรับการสร้างสถิติระดับคอลัมน์ตามกำหนดเวลาแล้ว

โพสต์บน: 13 พ.ย. 2024

ตอนนี้ แค็ตตาล็อกข้อมูลของ AWS Glue รองรับการสร้างสถิติระดับคอลัมน์ตามกำหนดเวลาสำหรับตาราง Apache Iceberg และรูปแบบไฟล์ เช่น Parquet, JSON, CSV, XML, ORC และ ION แล้ว การเปิดตัวนี้ทำให้คุณสามารถลดความซับซ้อนและทำให้การสร้างสถิติเป็นไปโดยอัตโนมัติด้วยการสร้างกำหนดการที่เกิดซ้ำในแค็ตตาล็อกข้อมูลของ Glue สถิติเหล่านี้ผสานรวมเข้ากับเครื่องมือเพิ่มประสิทธิภาพตามต้นทุน (CBO) จาก Amazon Redshift Spectrum และ Amazon Athena ซึ่งส่งผลให้ประสิทธิภาพการสืบค้นดีขึ้นและประหยัดต้นทุนได้

โดยก่อนหน้านี้ หากต้องการตั้งค่ากำหนดเวลาการสร้างสถิติที่เกิดซ้ำ คุณต้องเรียกใช้บริการของ AWS โดยใช้ AWS Lambda และ Amazon EventBridge Scheduler ร่วมกัน เมื่อใช้ฟีเจอร์ใหม่นี้ คุณจะสามารถจัดเตรียมกำหนดเวลาที่เกิดซ้ำเป็นการกำหนดค่าเพิ่มเติมให้กับแค็ตตาล็อกข้อมูลของ Glue พร้อมกับเปอร์เซ็นต์การสุ่มตัวอย่างได้ สำหรับการเรียกใช้งานตามกำหนดเวลาแต่ละครั้ง จะมีการรวบรวมจำนวนค่าที่แตกต่างกัน (NDV) สำหรับตาราง Apache Iceberg และสถิติเพิ่มเติม เช่น จำนวนค่าว่าง ค่าสูงสุด ค่าต่ำสุด และความยาวเฉลี่ยซึ่งจะถูกรวบรวมสำหรับรูปแบบไฟล์อื่น ๆ เมื่อมีการอัปเดตสถิติ Amazon Redshift และ Amazon Athena จะใช้สถิติเพื่อเพิ่มประสิทธิภาพการสืบค้นด้วย โดยใช้การเพิ่มประสิทธิภาพ เช่น คำสั่งการเข้าร่วมที่เหมาะสมหรือพุชดาวน์การรวมตามค่าใช้จ่าย คุณสามารถดูสถานะและช่วงเวลาของการเรียกใช้การสร้างสถิติแต่ละครั้ง ตลอดจนค่าสถิติที่อัปเดต

หากต้องการเริ่มต้นใช้งาน คุณสามารถกำหนดเวลาการสร้างสถิติโดยใช้คอนโซลแค็ตตาล็อกข้อมูลของ AWS Glue หรือ AWS Glue API การรองรับการสร้างสถิติแค็ตตาล็อกของ AWS Glue ตามกำหนดเวลาพร้อมใช้งานโดยทั่วไปในรีเจี้ยนทุกแห่งที่มี Amazon EventBridge Scheduler ให้บริการ ไปที่เอกสารประกอบแค็ตตาล็อกของ AWS Glue เพื่อเรียนรู้เพิ่มเติม

เลือกค่ากำหนดคุกกี้ของคุณ

ตอนนี้แค็ตตาล็อกข้อมูลของ AWS Glue รองรับการสร้างสถิติระดับคอลัมน์ตามกำหนดเวลาแล้ว

สิ้นสุดการรองรับ Internet Explorer