AWS Glue ช่วยเพิ่มขีดความสามารถของ Apache Spark สำหรับตาราง AWS Lake Formation ด้วยสิทธิ์การเข้าถึงตารางแบบเต็มรูปแบบ
AWS Glue รองรับการดำเนินการอ่านและเขียนจากงาน AWS Glue 5.0 บนตารางที่ลงทะเบียนใน AWS Lake Formation แล้ว เมื่อบทบาทของงานนั้นมีสิทธิ์การเข้าถึงตารางได้เต็มรูปแบบ ความสามารถนี้ช่วยให้สามารถดำเนินการ Data Manipulation Language (DML) ซึ่งรวมถึงคำสั่ง CREATE, ALTER, DELETE, UPDATE, และ MERGE INTO บนตาราง Apache Hive และ Iceberg ได้จากแอปพลิเคชัน Apache Spark เดียวกัน
แม้ว่าการควบคุมสิทธิ์การเข้าถึงแบบละเอียด (FGAC) ของ Lake Formation มีการควบคุมความปลอดภัยแบบละเอียดในระดับแถว คอลัมน์ และเซลล์ แต่เวิร์กโหลด ETL จำนวนมากต้องการเพียงแค่สิทธิ์การเข้าถึงตารางแบบเต็มรูปแบบเท่านั้น ฟีเจอร์ใหม่นี้ช่วยให้งาน AWS Glue 5.0 Spark สามารถอ่านและเขียนข้อมูลได้โดยตรงเมื่ออนุญาตให้เข้าถึงตารางเต็มรูปแบบ ลบข้อจำกัด ที่ก่อนหน้านี้ จำกัดการดำเนินการกระบวนการ Extract, Transform and Load (ETL) บางอย่าง ตอนนี้คุณสามารถใช้ประโยชน์จากความสามารถขั้นสูงของ Spark รวมถึงชุดข้อมูลแบบกระจายตัวแบบยืดหยุ่น (RDDs), ไลบรารีที่กำหนดเอง และฟังก์ชันที่กำหนดโดยผู้ใช้ (UDF) ด้วยตาราง Lake Formation นอกจากนี้ ทีมฝ่ายข้อมูลยังสามารถรันแอปพลิเคชัน Spark ที่ซับซ้อนและโต้ตอบได้ผ่าน SageMaker Unified Studio ในโหมดความเข้ากันได้ ในขณะที่ยังคงรักษาขอบเขตความปลอดภัยระดับตารางของ Lake Formation ไว้ได้
ฟีเจอร์นี้มีให้ใช้งานใน AWS Region ทุกแห่งที่รองรับ AWS Glue และ AWS Lake Formation หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่หน้าผลิตภัณฑ์ และเอกสารประกอบ AWS Glue