AWS Lake Formation ขยายสิทธิ์ของตารางให้สามารถเข้าถึงข้อมูลพื้นฐานใน Amazon S3 ได้
ขณะนี้ AWS Lake Formation ช่วยให้คุณสามารถอ่านและเขียนไฟล์ข้อมูลพื้นฐานใน Amazon S3 สำหรับตารางที่ลงทะเบียนไว้ในแค็ตตาล็อกข้อมูลของ AWS Glue ได้ ซึ่งจะช่วยให้คุณมีชุดสิทธิ์เดียวสำหรับทั้งการสืบค้น SQL และการเข้าถึงไฟล์โดยตรง โดยใช้การมอบสิทธิ์ตารางของ Lake Formation ที่มีอยู่เดิม
ด้วยการเปิดตัวครั้งนี้ Lake Formation จะจัดเตรียมข้อมูลประจำตัวชั่วคราวที่มีขอบเขตการใช้งานกำหนดไว้สำหรับตำแหน่งข้อมูล Amazon S3 ที่ลงทะเบียนไว้ โดยอิงตามสิทธิ์ของตาราง สิทธิ์ SELECT จะมอบสิทธิ์การอ่าน และสิทธิ์ SUPER จะมอบสิทธิ์การอ่านและการเขียนให้กับข้อมูลในตำแหน่งข้อมูลนั้น ๆ ความสามารถนี้มาพร้อมกับ Amazon EMR 7.13 หรือเวอร์ชันที่ใหม่กว่า ด้วยเหตุนี้ คุณจึงสามารถเข้าถึงไฟล์ข้อมูลได้โดยตรงจากงาน Spark ของคุณสำหรับ Task ที่ต้องการการเข้าถึงในระดับไฟล์ เช่น การฝึกโมเดล กระบวนการสร้างฟีเจอร์ใหม่ และการแก้ไขข้อบกพร่องของปัญหาคุณภาพข้อมูล
คุณยังสามารถผสานรวมแอปพลิเคชัน Apache Spark หรือ Trino ของคุณโดยใช้ API หรือผ่านปลั๊กอินแบบโอเพนซอร์สที่ AWS จัดเตรียมให้ นอกจากนี้ การเข้าถึงทั้งหมดจะถูกบันทึกไว้ใน AWS CloudTrail เพื่อจัดเตรียมเส้นทางการตรวจประเมินแบบรวมศูนย์สำหรับทั้งการดำเนินการแบบ SQL และการดำเนินการกับไฟล์บนตารางของคุณ
ฟีเจอร์นี้พร้อมใช้งานโดยไม่มีค่าใช้จ่ายเพิ่มเติมใน AWS Region ทุกแห่งที่มี AWS Lake Formation ให้บริการ หากต้องการเรียนรู้เพิ่มเติม โปรดดูเอกสารประกอบของ Lake Formation, เอกสารประกอบของ EMR, เอกสารอ้างอิง API และปลั๊กอินแบบโอเพนซอร์ส