Amazon S3 รองรับการบีบอัดข้อมูลรูปแบบ Apache Avro และ ORC สำหรับตาราง Apache Iceberg แล้ว
Amazon S3 ได้ขยายการรองรับการบีบอัดข้อมูลเพื่อรวมรูปแบบ Apache Avro และ ORC สำหรับตาราง Apache Iceberg ซึ่งเป็นการเสริมความสามารถของรูปแบบ Parquet ที่มีอยู่เดิม การปรับปรุงนี้ใช้งานได้ทั้งกับตาราง S3 และกับบัคเก็ตสำหรับการใช้งานทั่วไป S3 โดยใช้การเพิ่มประสิทธิภาพของแค็ตตาล็อกข้อมูลของ AWS Glue
ในขณะที่ Parquet เป็นรูปแบบเริ่มต้นสำหรับตาราง Iceberg คุณยังสามารถเขียนข้อมูลในรูปแบบ Avro หรือ ORC สำหรับเวิร์กโหลดเฉพาะได้ ตัวอย่างเช่น คุณสามารถใช้ Avro เพื่อปรับปรุงประสิทธิภาพการเขียนสำหรับการนำข้อมูลเข้าและกรณีการใช้งานการสตรีม เช่น ธุรกรรมการซื้อรายวัน ข้อมูลเซนเซอร์แบบสตรีมมิ่ง หรือการรวบรวมการแสดงผลโฆษณา ตาราง S3 จะบีบอัดไฟล์ขนาดเล็กให้เป็นไฟล์ขนาดใหญ่ขึ้นโดยอัตโนมัติ เพื่อลดปริมาณข้อมูลที่ถูกสแกน ปรับปรุงประสิทธิภาพการสืบค้น และลดค่าใช้จ่าย โดยค่าเริ่มต้น การบีบอัดข้อมูลจะแปลงไฟล์ Avro และ ORC เป็น Parquet เพื่อประสิทธิภาพการอ่านที่เหมาะสมที่สุด แต่คุณสามารถระบุรูปแบบเป้าหมายที่คุณต้องการได้ในคุณสมบัติของตาราง
การรองรับการบีบอัดข้อมูลสำหรับรูปแบบ Apache Avro และ ORC พร้อมใช้งานแล้วใน AWS Region ทุกแห่งที่มีตาราง S3 หรือการเพิ่มประสิทธิภาพด้วยแค็ตตาล็อกข้อมูลของ AWS Glue ให้บริการ หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการบีบอัดข้อมูลของตาราง S3 โปรดดูเอกสารประกอบการบำรุงรักษาตาราง S3 สำหรับการเพิ่มประสิทธิภาพบัคเก็ตสำหรับการใช้งานทั่วไป โปรดดูเอกสารประกอบการเพิ่มประสิทธิภาพแค็ตตาล็อกข้อมูลของ AWS Glue