يمكِّن Amazon EMR إمكانات Apache Spark المحسّنة لجداول Lake Formation مع إمكانية الوصول الكامل إلى الجدول

:تاريخ النشر 29 مايو 2025

تدعم Amazon EMR الآن عمليات القراءة والكتابة من وظائف Apache Spark على جداول AWS Lake Formation المسجلة عندما يكون للدور الوظيفي حق الوصول الكامل إلى الجدول. تعمل هذه الإمكانية على تمكين عمليات لغة معالجة البيانات (DML) بما في ذلك عبارات الإنشاء والتبديل والحذف والتحديث والدمج على جداول Apache Hive وIceberg من داخل تطبيق Apache Spark نفسه.

بينما يوفر التحكم في الوصول الدقيق لدى Lake Formation (FGAC) عناصر تحكم أمنية دقيقة على مستويات الصفوف والأعمدة والخلايا، حيث تحتاج العديد من أعباء عمل ETL ببساطة إلى الوصول الكامل إلى الجدول. تمكِّن هذه الميزة الجديدة Apache Spark من قراءة البيانات وكتابتها مباشرةً عند منح الوصول الكامل إلى الجدول، وإزالة قيود FGAC التي قيدت عمليات ETL معينة في السابق. يمكنك الآن الاستفادة من إمكانات Spark المتقدمة بما في ذلك RDDs والمكتبات المخصصة وUDFs والصور المخصصة (AMIs لـ EMR على EC2، الصور المخصصة لـ EMR بلا خادم) باستخدام جداول Lake Formation. بالإضافة إلى ذلك، يمكن لفرق البيانات تشغيل تطبيقات Spark المعقدة والتفاعلية من خلال استوديو SageMaker Unified في وضع التوافق مع الحفاظ على حدود الأمان على مستوى جدول Lake Formation.

تتوفر هذه الميزة في جميع مناطق AWS التي يتم دعم Amazon EMR وAWS Lake Formation فيها.

لمعرفة المزيد حول هذه الميزة، تفضل بزيارة قسم الوصول غير المفلتر لـ Lake Formation في وثائق EMR بلا خادم.