مع AWS Glue، تدفع سعرًا بالساعة محسوبًا بالثانية لبرامج التتبع (اكتشاف البيانات) ومهام الاستخراج، والانتقال، والتحميل (ETL) (معالجة البيانات وتحميلها). مقابل كتالوج بيانات AWS Glue، تدفع رسمًا شهريًا بسيطًا مقابل تخزين بيانات التعريف والوصول إليها. يجري تخزين أول مليون كائن مجانًا وتوفير أول مليون وصول مجانًا. إذا وفرت نقطة نهاية تطوير من أجل التطوير التفاعلي لتعليمات الاستخراج، والانتقال، والتحميل (ETL) البرمجية لديك، فإنك تدفع سعرًا بالساعة محسوبًا بالثانية. بالنسبة إلى AWS Glue DataBrew، تُحسَب الجلسات التفاعلية بالجلسة، وتُحسَب مهام DataBrew بالدقيقة. يُقدَّم استخدام سجل مخطط AWS Glue بدون رسوم إضافية.

ملاحظة: قد يختلف التسعير حسب منطقة AWS.

  • مهام الاستخراج والانتقال والتحميل (ETL) والجلسات التفاعلية
  • أمثلة التسعير

    مهمة ETL: لنفترض أن مهمة AWS Glue Apache Spark تعمل لمدة 15 دقيقةً وتستخدم 6 من وحدات DPU. يبلغ سعر وحدة DPU في الساعة 0.44 USD. نظرًا لأن مهمتك عملت لمدة 1/4 ساعة واستخدمت 6 وحدات DPU، فستُصدر AWS لك الفاتورة التالية: 6 وحدات DPU ‏* 1/4 ساعة * 0.44 USD، أو 0.66 USD.

    دفاتر المهام والجلسات التفاعلية في AWS Glue Studio: لنفترض أنك تستخدم أحد الدفاتر في AWS Glue Studio لتطوير تعليمة ETL البرمجية بطريقة تفاعلية. في الوضع الافتراضي، يكون للجلسة التفاعلية 5 وحدات DPU. إذا واصلت تشغيل الجلسة لمدة 24 دقيقة أو 2/5 من الساعة، فستدفع مقابل 5 وحدات DPU ‏* 2/5 ساعة بسعر 0.44 USD لكل وحدة DPU في الساعة أو 0.88 USD.

    تحويلات تعلّم الآلة: على غرار مهام AWS Glue، ستختلف تكلفة تشغيل تحويلات تعلّم الآلة، ومن بينها FindMatches على بياناتك، وفقًا لحجم بياناتك ومحتواها وعدد العُقد التي تستخدمها وأنواعها. في المثال التالي، استخدمنا FindMatches لدمج معلومات نقاط الاهتمام من مصادر متعددة للبيانات. مع حجم مجموعة بيانات يقارب 11000000 صف (1.6 جيجابايت)، وحجم بيانات تسمية (أمثلة على التطابقات الصحيحة أو عدم التطابقات الصحيحة) لما يقارب 8000 صف (641 كيلوبايت)، تعمل على 16 مثيلاً من النوع G.2x، سيكون وقت تشغيل جيل التسميات 34 دقيقة بتكلفة 8.23 USD، ووقت تشغيل تقدير المقاييس 11 دقيقة بتكلفة 2.66 USD، ووقت تشغيل مهام FindingMatches ‏32 دقيقة بتكلفة 7.75 USD.

  • كتالوج البيانات
  • تحسين مخزن البيانات

    يدعم كتالوج بيانات AWS Glue إنشاء إحصائيات على مستوى الأعمدة لجداول AWS Glue. تم دمج هذه الإحصائيات الآن مع المُحسِّن المستند إلى التكلفة (CBO) من Amazon Athena وAmazon Redshift Spectrum، ما يؤدي إلى تحسين أداء الاستعلام وتوفير التكاليف المحتملة. يرجى الاطلاع على وثائقنا

    يدعم كتالوج بيانات AWS Glue الدمج التلقائي لجداول Apache Iceberg، ما يجعل من السهل الحفاظ على جودة أداء مخازن بيانات المعاملات دائمًا. الدمج هو إجراء لتحسين التخزين يجمع عددًا كبيرًا من الملفات الصغيرة في عدد صغير من الملفات الكبيرة. يمكنك تمكين الدمج من وحدة تحكم AWS وواجهة برمجة التطبيقات وواجهات سطر الأوامر (CLI). يرجى الاطلاع على وثائقنا.

    تدفع سعرًا بالساعة بناءً على عدد وحدات معالجة البيانات (أو DPU) المستخدمة في تحسين مخازن البيانات. وحدة معالجة البيانات (DPU) الواحدة توفر 4 وحدات معالجة مركزية افتراضية (vCPU) بالإضافة إلى 16 جيجابايت من الذاكرة. تدفع بزيادات لمدة ثانية واحدة مع التقريب لأقرب ثانية، بحد أدنى مدته دقيقة واحدة لكل عملية تشغيل.

    أمثلة على التسعير

    الطبقة المجانية من كتالوج بيانات AWS Glue: لنفترض الآن أنك تخزن مليون جدول في "كتالوج البيانات" في شهر معين وتقدم مليون طلب للوصول إلى هذه الجداول. تدفع 0 USD لأن استخدامك سيكون ضمن الطبقة المجانية من كتالوج بيانات AWS Glue. يمكنك مجانًا تخزين أول مليون كائن وتقديم مليون طلب كل شهر.

    كتالوج بيانات AWS Glue: افترض الآن أن استخدام التخزين لديك سيظل كما هو عند 1 مليون جدول في الشهر، ولكن طلباتك تضاعفت إلى مليوني طلب في الشهر. لنفترض أنك أيضًا تستخدم برامج تتبع للعثور على جداول جديدة وهي تعمل لمدة 30 دقيقة وتستهلك اثنتين من وحدات معالجة بيانات (DPUs).

    تظل تكلفة تخزينك 0 USD لأن تخزين أول مليون جدول لديك مجاني. أول مليون طلب لك مجانًا أيضًا. ستدفع مقابل 1 مليون طلب فوق الطبقة المجانية، ويبلغ 1 USD. يتم تحرير فواتير برامج التتبع بسعر 0.44 USD لكل وحدة معالجة بيانات في الساعة، ولذلك ستدفع مقابل اثنتين من وحدات معالجة البيانات * 1/2 ساعة بسعر 0.44 USD لكل وحدة معالجة بيانات في الساعة أو 0.44 USD. سيعني هذا فاتورة شهرية إجمالية تبلغ 1.44 USD.

    لنفترض أنك تستخدم تحسين مخزن البيانات لدمج جداول Iceberg أو إنشاء إحصائيات الأعمدة على جداول Parquet، وأنها تعمل لمدة 30 دقيقة وتستهلك وحدتي معالجة بيانات (DPU).
    تُحرر فواتير تحسين مخزن البيانات بسعر 0.44 USD لكل وحدة معالجة بيانات في الساعة، ولذلك تدفع مقابل اثنتين من وحدات معالجة البيانات * 1/2 ساعة بسعر 0.44 USD لكل وحدة معالجة بيانات في الساعة أو 0.44 USD.

  • برامج التتبع
  • جلسات DataBrew تفاعلية
  • أمثلة التسعير

    AWS Glue DataBrew: يبلغ السعر لكل جلسة تفاعلية مدتها 30 دقيقة 1.00 USD. إذا بدأت جلسةً في الساعة 9:00 صباحًا وغادرت وحدة التحكم على الفور ثم عدت من الساعة 9:20 صباحًا إلى 9:30 صباحًا، فسيحسب ذلك على أنه جلسة واحدة بإجمالي 1.00 USD.

    إذا بدأت جلسةً في الساعة 9:00 صباحًا وتفاعلت مع وحدة تحكم DataBrew حتى الساعة 9:50 صباحًا، ثم خرجت من مساحة مشروع DataBrew وعدت لإجراء تفاعلك النهائي في الساعة 10:15 صباحًا، فسيحسب ذلك على أنه 3 جلسات وستتم محاسبتك بمبلغ 1.00 USD لكل جلسة بإجمالي 3.00 USD.

  • مهام DataBrew
  • أمثلة التسعير

    AWS Glue DataBrew: إذا استمر تشغيل مهمة DataBrew لمدة 10 دقائق واستهلك 5 عُقد DataBrew، فإن السعر يكون 0.40 USD. بما أن مهمتك استمرت لمدة 1/6 من الساعة واستهلاكها 5 عُقد، فستكون فاتورتك كالتالي: 5 عُقد * 1/6 ساعة * 0.48 USD لكل ساعة عُقدة بإجمالي 0.40 USD.

  • جودة البيانات
  • أمثلة التسعير

     

    المثال 1 - الحصول على توصيات لجدول في كتالوج البيانات

    على سبيل المثال، لنفترض وجود مهمة توصية تستخدم 5 وحدات معالجة بيانات تكتمل في 10 دقائق. ستدفع 5 وحدات معالجة بيانات * 1/6 ساعة * 0.44 USD، وهو ما يساوي 0.37 USD. 

    المثال 2 - تقييم جودة البيانات لجدول في كتالوج البيانات

    بعد مراجعتك للتوصيات، يمكنك تحريرها إذا لزم الأمر ثم جدولة مهمة جودة البيانات من خلال توفير وحدات معالجة البيانات. على سبيل المثال، لنفترض وجود مهمة تقييم جودة بيانات تستخدم 5 وحدات معالجة بيانات تكتمل في 20 دقيقة.

    ستدفع 5 وحدات معالجة بيانات * 1/3 ساعة * 0.44 USD، وهو ما يساوي 0.73 USD. 

    المثال 3 - تقييم جودة البيانات في مهمة الاستخراج، والانتقال، والتحميل (ETL) ضمن AWS Glue

    يمكنك أيضًا إضافة عمليات تحقق من جودة البيانات هذه إلى مهام الاستخراج، والانتقال، والتحميل (ETL) ضمن AWS Glue لمنع البيانات غير الصالحة من دخول مخازن بياناتك. يمكنك إجراء ذلك بإضافة تحويل جودة البيانات على AWS Glue Studio أو استخدام واجهات برمجة التطبيقات في AWS Glue ضمن التعليمة البرمجية التي تصيغها في دفاتر AWS Glue Studio. لنفترض وجود مهمة AWS Glue يجري تشغيلها حيث يتم تكوين قواعد جودة البيانات ضمن المسارات، وتستغرق هذه المهمة 20 دقيقة (1/3 ساعة) باستخدام 6 وحدات معالجة بيانات. ستدفع 6 وحدات معالجة بيانات * 1/3 ساعة * 0.44 USD، وهو ما يساوي 0.88 USD. بدلاً من ذلك، يمكنك استخدام Flex، التي ستدفع مقابله 6 وحدات معالجة بيانات * 1/3 ساعة * 0.29 USD، وهو ما يساوي 0.58 USD.

     

ملاحظة: قد يختلف التسعير حسب المنطقة.

اعرض جدول المناطق العالمية للتعرُّف على المزيد حول توافر AWS Glue.

موارد التسعير الإضافية

حاسبة تسعير AWS

احتساب تكاليفك الشهرية لدى AWS بسهولة

الحصول على المساعدة في التسعير

التواصل مع متخصصي AWS للحصول على عرض أسعار مخصص

بدء استخدام AWS Glue
تعرف كيف تبدأ مع AWS Glue

اطّلع على الخطوات لبدء الاستخدام والوصول إلى مقاطع الفيديو والموارد.

تعرّف على المزيد 
التسجيل للحصول على حساب AWS
تسجيل الاشتراك للحصول على حساب مجاني

تمتع بالوصول الفوري إلى الطبقة المجانية من AWS. 

تسجيل الاشتراك 
بدء الإنشاء في وحدة التحكم
بدء الإنشاء في وحدة التحكم

ابدأ في البناء باستخدام AWS Glue في وحدة الإدارة في AWS.

تسجيل الدخول