Amazon EMR บน EC2 เพิ่มการรองรับมุมมอง FGAC และมุมมองแค็ตตาล็อกข้อมูลของ AWS Glue ใน Apache Spark

โพสต์บน: 29 ส.ค. 2025

Amazon EMR บน EC2 ประกาศเปิดตัวการปรับปรุงที่สำคัญสองประการสำหรับการกำกับดูแล ได้แก่ การควบคุมการเข้าถึงแบบละเอียดในตัวของ Apache Spark (FGAC) ผ่าน AWS Lake Formation และการรองรับมุมมองแค็ตตาล็อกข้อมูลของ AWS Glue ฟีเจอร์เหล่านี้ช่วยให้องค์กรสามารถปรับปรุงความปลอดภัยของข้อมูล จัดการสิทธิ์การเข้าถึงให้ง่ายขึ้น และปรับปรุงความสามารถในการแบ่งปันข้อมูลในสภาพแวดล้อมการวิเคราะห์ของตน

การนำ FGAC ในตัวของ Apache Spark มาใช้ช่วยให้ลูกค้าสามารถกำหนดนโยบายการเข้าถึงแบบละเอียดใน AWS Lake Formation เพียงหนึ่งครั้ง แล้วจากนั้นระบบก็จะสิทธิ์เข้าถึงนั้นไปใช้กับคลัสเตอร์ EMR อย่างสม่ำเสมอ วิธีนี้จะช่วยลดความเสี่ยงด้านความปลอดภัยและค่าใช้จ่ายในการบริหารจัดการ พร้อมทั้งยังมอบแนวทางแบบรวมศูนย์ในการกำกับดูแลข้อมูลอีกด้วย ขณะนี้ลูกค้าสามารถใช้คำสั่งอนุญาตและเพิกถอน Lake Formation ที่คุ้นเคยเพื่อจัดการการควบคุมการเข้าถึงสำหรับงาน Spark และเซสชันแบบโต้ตอบบน EMR บน EC2 ได้ ในลักษณะที่คล้ายกับวิธีการทำงานสำหรับบริการวิเคราะห์อื่นๆ ของ AWS

มุมมองแค็ตตาล็อกข้อมูลของ AWS Glue ช่วยให้ลูกค้าสามารถสร้าง จัดการ และเรียกใช้มุมมอง SQL แบบหลายกลไกใน AWS Region, บัญชี และองค์กรต่างๆ ได้ ฟีเจอร์นี้ช่วยให้ผู้ดูแลระบบสามารถสร้างมุมมองจากงาน Spark ที่สามารถเรียกใช้ได้จากหลายกลไก พร้อมทั้งควบคุมการเข้าถึงข้อมูลผ่านสิทธิ์ของ Lake Formation สิทธิ์อนุญาตเหล่านี้รวมถึงการอนุญาตให้เข้าถึงทรัพยากรที่มีชื่อ ตัวกรองข้อมูล และแท็ก โดยคำขอเข้าถึงทั้งหมดจะบันทึกไว้โดยอัตโนมัติใน AWS CloudTrail เพื่อให้ตรวจสอบได้อย่างครอบคลุม

ฟีเจอร์มุมมอง FGAC ในตัวและแค็ตตาล็อกข้อมูลของ Glue ของ Apache Spark พร้อมใช้งานกับ Amazon EMR รุ่น 7.10 ในทุก AWS Region ที่มี EMR บน EC2 ให้บริการ หากต้องการเรียนรู้เพิ่มเติม โปรดดูการใช้ AWS Lake Formation กับ Amazon EMR และการทำงานกับมุมมองแค็ตตาล็อกข้อมูลของ AWS Glue ในเอกสารประกอบ Amazon EMR