مع Amazon Athena، لا تدفع إلا مقابل ما تستخدمه. لا توجد رسوم مقدمة ولا حد أدنى مطلوب من الالتزامات وليست هناك عقود طويلة المدى. تُحاسب في نهاية الشهر مقابل استخدامك.
للبدء، تنشئ مجموعة عمل تسمح لك بتحديد محرك الاستعلامات، ودليل العمل في خدمة التخزين البسيطة في Amazon (S3) للاحتفاظ بنتائج التنفيذ، وأدوار إدارة الهوية والوصول في AWS (IAM) (إذا لزم الأمر) وعلامات الموارد. يمكنك استخدام مجموعات العمل لتقسيم المستخدمين أو الفرق أو التطبيقات أو أعباء العمل، ولوضع حدود على كمية البيانات التي يمكن لكل استعلام أو مجموعة عمل بأكملها معالجتها، ولتتبع التكاليف. بناءً على مجموعة العمل التي تنشئها، يمكنك إما (أ) تشغيل الاستعلامات المستندة إلى SQL وتُحاسب نظير عدد وحدات البايت من البيانات المفحوصة أو (ب) تشغيل تعليمة Apache Spark Python البرمجية وتُحاسب نظير تنفيذ تعليمتك البرمجية بسعر الساعة.
السعر لكل استعلام
وفّر المزيد عندما تستخدم التنسيقات العمودية للبيانات، وتجزئة بياناتك وضغطها.
يمكنك توفير ما بين 30% و90% من تكاليف الاستعلام الخاصة بك واحصل على أداء أفضل عن طريق ضغط بياناتك وتجزئتها وتحويلها إلى تنسيقات عمودية.
تفاصيل التسعير
الاستعلامات المستندة إلى SQL باستخدام محرر الاستعلامات أو واجهة سطر الأوامر من AWS (CLI)
تُحاسب بناءً على مقدار البيانات المفحوصة بواسطة كل استعلام. يمكنك الحصول على وفورات كبيرة في التكلفة ومكاسب في الأداء من خلال ضغط بياناتك أو تجزئتها أو تحويلها إلى تنسيق عمودي، نظرًا إلى أن كل عملية من تلك العمليات تقلل من كمية البيانات التي تحتاج Athena إلى فحصها لتشغيل استعلام ما.
تُحاسب مقابل عدد وحدات البايت من البيانات التي تفحصها Athena مع التقريب لأقرب ميجابايت، بحد أدنى 10 ميجابايت لكل استعلام. لا تُفرض رسوم على عبارات لغة تعريف البيانات (DDL)، مثل "إنشاء/تعديل/إسقاط الجدول" أو عبارات إدارة الأجزاء، أو الاستعلامات الفاشلة. تُحتسب رسوم الاستعلامات الملغاة بناءً على مقدار البيانات المفحوصة.
إن ضغط بياناتك يتيح لخدمة Athena فحص بيانات أقل. كما أن تحويل بياناتك إلى تنسيقات عمودية يتيح لخدمة Athena أن تقرأ فقط الأعمدة المطلوبة لمعالجة البيانات بطريقة انتقائية. تدعم Athena كلا من Apache ORC وApache Parquet. كما أن تجزئة بياناتك يتيح أيضًا لخدمة Athena أن تقيِّد كمية البيانات التي يتم فحصها. وهذا يؤدي إلى توفير في التكاليف وتحسين الأداء. يمكنك الاطلاع على كمية البيانات التي يتم فحصها لكل استعلام على وحدة التحكم Athena. لمعرفة التفاصيل، انظر مثال التسعير التالي.
تسعير الاستعلام المتحد
تُحاسب مقابل عدد وحدات البايت التي تفحصها Athena، المجمَّعة عبر كل مصادر البيانات، مع التقريب لأقرب ميجابايت، بحد أدنى 10 ميجابايت لكل استعلام.
شغِّل تعليمة Apache Spark Python البرمجية باستخدام دفاتر الملاحظات أو واجهة سطر الأوامر من AWS (CLI)
إنك لا تدفع إلا مقابل الوقت الذي يستغرقه تطبيق Apache Spark في التشغيل. تجرى محاسبتك بالساعة بناءً على عدد وحدات معالجة البيانات (DPU) المستخدَمة في تشغيل تطبيق Apache Spark. توفر وحدة معالجة البيانات المفردة 4 وحدات معالجة مركزية افتراضية (vCPU) بالإضافة إلى 16 جيجابايت من الذاكرة. تُحرر لك فاتورة بزيادات لمدة ثانية واحدة مع التقريب لأقرب ثانية.
عندما تبدأ جلسة Spark، إما عن طريق بدء دفتر ملاحظات في وحدة تحكم Athena أو باستخدام واجهة برمجة تطبيقات (API) Athena، تُوفر عقدتان لتطبيقك: عقدة دفتر الملاحظات التي تعمل كخادم لواجهة مستخدم دفتر الملاحظات وعقدة برنامج تشغيل Spark التي ستنسق تطبيق Spark والاتصال بجميع عُقد العامل في Spark. تكون عُقد العامل في Spark مسؤولة عن تشغيل مهام تطبيق Spark. بعد أن تبدأ جلسة ما، يمكنك تشغيل تطبيق Spark إما عن طريق تنفيذ الخلايا في دفتر الملاحظات أو باستخدام واجهة برمجة تطبيقات البدء-الحساب-التنفيذ. عندما تشغل تطبيق Spark، توفر Athena عُقد العامل في Spark لتطبيقك. عندما يكمل التطبيق التنفيذ، تُحرر عُقد العامل. نظرًا إلى أن Athena for Apache Spark تقلص على الفور الموارد تلقائيًا، فإن Athena تقلل ما تدفعه من رسوم في وضع الخمول إلى أدنى حد. عند الانتهاء من جلسة Spark، تُحرر عُقد برنامج التشغيل وأي من عُقد العامل وعُقد دفتر الملاحظات. ستفرض Athena عليك رسومًا مقابل عُقد برنامج التشغيل وعُقد العامل خلال مدة الجلسة. توفر Athena دفاتر ملاحظات على وحدة التحكم باعتبارها واجهة مستخدم لإنشاء تطبيقات Spark وإرسالها وتنفيذها وتقدمها لك بدون أي تكلفة إضافية. لا تفرض Athena رسومًا نظير استخدام عٌقد دفاتر الملاحظات أثناء جلسة Spark.
التكاليف الإضافية
تستعلم Athena عن البيانات مباشرةً من Amazon S3. ولا توجد رسوم إضافية على التخزين مقابل الاستعلام عن بياناتك باستخدام Athena. تُحاسب بأسعار S3 القياسية مقابل التخزين، والطلبات، ونقل البيانات. بشكل افتراضي، تُخزن نتائج الاستعلام في حاوية S3 من اختيارك وتُعد أيضًا فاتورة لها حسب أسعار S3 القياسية.
إذا استخدمت كتالوج بيانات AWS Glue مع Athena، فستُحاسب بأسعار كتالوج بيانات AWS Glue القياسية. للحصول على التفاصيل، يمكنك زيارة صفحة تسعير AWS Glue.
إضافةً إلى ذلك، فإنك تُحاسب بالأسعار القياسية مقابل خدمات AWS التي تستخدمها مع Athena، مثل Amazon S3 وAWS Lambda وAWS Glue وAmazon SageMaker. على سبيل المثال، تُحاسب بأسعار S3 القياسية مقابل التخزين، والطلبات، ونقل البيانات بين المناطق. بشكل افتراضي، تُخزن نتائج الاستعلام في حاوية S3 من اختيارك وتُعد أيضًا فاتورة لها حسب أسعار S3 القياسية. إذا كنت تستخدم Lambda، تُحاسب بناءً على عدد الطلبات الخاصة بالوظائف والمدة؛ الوقت الذي تستغرقه في تشغيل التعليمة البرمجية.
تستخدم الاستعلامات المتحدة وظائف Lambda في حسابك، وتُحاسب نظير استخدام Lambda بالأسعار القياسية. تخضع وظائف Lambda المستخدمة بواسطة الاستعلامات المتحدة للطبقة المجانية في Lambda. للحصول على التفاصيل، يمكنك زيارة صفحة تسعير Lambda.
مثال على التسعير
المثال 1 – استعلام SQL
افترض أن هناك جدولاً يحتوي على 4 أعمدة متساوية في الحجم، وهو مُخزَّن بتنسيق ملف نصي غير مضغوط بحجم إجمالي يبلغ 3 تيرابايت على Amazon S3. فإن تشغيل استعلام للحصول على بيانات من عمود واحد من الجدول يتطلب من Amazon Athena فحص الملف بالكامل لأن تنسيقات النصوص غير قابلة للفصل.
- وسيتكلف هذا الاستعلام: USD 15. (السعر مقابل فحص 3 تيرابايت يساوي 3 × USD 5/تيرابايت = 15 USD).
إذا ضغطت ملفك باستخدام GZIP، فقد تحقق مكاسب من الضغط بنسبة 3:1. وفي هذه الحالة، سيكون لديك ملف مضغوط بحجم 1 تيرابايت. يتكلف الاستعلام نفسه على هذا الملف USD 5. ويجب أن تفحص خدمة Athena الملف بالكامل مرة أخرى، ولكنه نظرًا إلى أنه أصغر في الحجم بمقدار ثلاث مرات، فستدفع ثلث ما دفعته من قبل. وإذا ضغطت ملفك وحولته أيضًا إلى تنسيق عمودي، مثل Apache Parquet، وبتحقيق ضغط بمقدار 3:1، فستحصل في نهاية المطاف على 1 تيرابايت من البيانات على S3. ولكن في هذه الحالة، بما أن Parquet بتنسيق عمودي، يمكن لخدمة Athena أن تكتفي بقراءة العمود ذي الصلة بالاستعلام قيد التشغيل. ولأن الاستعلام المقصود لا يشير إلا إلى عمود واحد، فلا تقرأ خدمة Athena سوى ذلك العمود ويمكن أن تتجنب قراءة ثلاثة أرباع الملف. وبما أن Athena لا تقرأ سوى ربع الملف، فإنها لا تفحص سوى 0.25 تيرابايت من البيانات من S3.
- وسيتكلف هذا الاستعلام: 1.25 USD. يحقق ضغط الملف وفورات بمقدار 3 أضعاف ويحقق قراءة عمود واحد فقط وفورات بمقدار 4 أضعاف.
(حجم الملف = 3 تيرابايت/3 = 1 تيرابايت. البيانات المفحوصة عند قراءة عمود واحد = 1 تيرابايت/4 = 0.25 تيرابايت. السعر مقابل 0.25 تيرابايت = 0.25 × 5 USD/تيرابايت = 1.25 USD)
المثال 2 – تطبيق Apache Spark
افترض أنك تستخدم دفتر ملاحظات في وحدة تحكم Athena لسحب أرقام المبيعات للربع السنوي السابق ورسمها بيانيًا لإنشاء تقرير. تبدأ جلسة باستخدام دفتر الملاحظات. تستمر جلستك لمدة ساعة، وتقدم 6 عمليات حسابية كجزء من الجلسة. يستغرق تشغيل كل عملية حسابية 20 عقدة عامل المخصص لكل منها وحدة معالجة بيانات واحدة وتستمر لمدة دقيقة واحدة.
- وحدة معالجة البيانات في الساعة للعامل = عدد العمليات الحسابية × وحدات معالجة البيانات المستخدَمة لكل العمليات الحسابية × وقت تنفيذ العملية الحسابية = 6 عمليات حسابية × 20 وحدة معالجة بيانات لكل عملية حسابية × (1/60) ساعة لكل عملية حسابية = 2.0 وحدة معالجة بيانات في الساعة
- وحدات معالجة البيانات في الساعة لبرنامج التشغيل = وحدات معالجة البيانات المستخدَمة لكل جلسة × وقت الجلسة = 1 وحدة معالجة بيانات لكل جلسة × 1 ساعة لكل جلسة = 1.0 وحدة معالجة بيانات في الساعة
- إجمالي وحدات معالجة البيانات في الساعة = وحدات معالجة البيانات في الساعة للعامل + وحدات معالجة البيانات في الساعة لبرنامج التشغيل = 2.0 وحدة معالجة بيانات في الساعة + 1.0 وحدة معالجة بيانات في الساعة = 3.0 وحدات معالجة بيانات في الساعة
- رسوم تطبيق Spark = 0.35 USD لكل وحدة معالجة بيانات في الساعة * 3.0 وحدات معالجة بيانات في الساعة = USD 1.05
ملاحظة: ستحاسبك S3 بشكل منفصل على تخزين بياناتك ونتائج التنفيذ وقراءتها.
موارد التسعير الإضافية
احتساب تكاليفك الشهرية لدى AWS بسهولة
التواصل مع متخصصي AWS للحصول على عرض أسعار مخصص

ابدأ الإنشاء باستخدام Amazon Athena في وحدة إدارة تحكم AWS.