عام

لاكتشاف ما هو جديد مع Amazon Redshift، يُمكنك زيارة صفحة كل ما هو جديد.
لعرض المزيد من المعلومات التفصيلية وإرشادات الاستخدام، يُمكنك زيارة الوثائق.

س: ما المقصود بـ Amazon Redshift؟

Amazon Redshift عبارة عن مستودع بيانات سحابي قابل للتوسع ومُدار بالكامل يعمل على تسريع وتيرة وصولك إلى الرؤى من خلال التحليلات السريعة، والسهلة، والآمنة على نطاق واسع. يعتمد آلاف العملاء على Amazon Redshift في تحليل البيانات التي يتراوح حجمها من وحدات التيرابايت إلى وحدات البيتابايت وفي إجراء الاستعلامات التحليلية المعقدة. يُمكنك الحصول على رؤى وتحليلات تنبؤية في الوقت الفعلي على جميع بياناتك في قواعد البيانات التشغيلية، ومخزن البيانات، ومستودع البيانات، ومجموعات البيانات التابعة لأطراف خارجية. يوفر Amazon Redshift كل هذا بأداء تسعيري أفضل بمقدار 3 مرات من مستودعات البيانات السحابية الأخرى، ما يساعدك في توقع تكاليفك.

ييسّر Amazon Redshift Serverless عليك إجراء التحليلات على نطاق البيتابايت في ثوانٍ للحصول على رؤى سريعة بدون الحاجة إلى تكوين مجموعات مستودع البيانات وإدارتها. يوفر Amazon Redshift Serverless سعة مستودع البيانات ويوسّع هذه السعة تلقائيًا للحصول على أداء عالٍ لأعباء العمل المتطلبة وغير المتوقعة، ولن تدفع سوى مقابل الموارد التي تستخدمها.

س: ما أهم الأسباب وراء اختيار العملاء لـ Amazon Redshift؟

يختار آلاف العملاء Amazon Redshift لتسريع زمن حصولهم على الرؤى لأنه سهل الاستخدام ويوفر أداءً على أي نطاق ويسمح لك بتحليل جميع بياناتك. Amazon Redshift عبارة عن خدمة مُدارة بالكامل وتقدم كلاً من الخيار الموفَّر والخيار بلا خوادم، وهذا ييسّر عليك تشغيل التحليلات وتوسعتها بدون الحاجة إلى إدارة مستودع البيانات. يمكنك اعتماد الخيار الموفَّر في أعباء العمل القابلة للتنبؤ أو اللجوء إلى الخيار بلا خوادم Amazon Redshift Serverless لتوفير سعة مستودع البيانات وتوسعتها تلقائيًا لتقديم أداء عالٍ لأعباء العمل المتطلبة وغير المتوقعة. يوفر أداءً على أي نطاق وبسعر أفضل بمقدار 3 مرات من مستودعات البيانات السحابية الأخرى، ما يساعدك في توقع تكاليفك. يسمح لك Amazon Redshift في الحصول على الرؤى من إجراء التحليلات التنبؤية في الوقت الفعلي على جميع بياناتك في قواعد البيانات التشغيلية، ومخزن البيانات، ومستودع البيانات، والآلاف من مجموعات البيانات التابعة لأطراف خارجية. يحتفظ Amazon Redshift ببياناتك آمنةً أثناء النقل وفي أوقات عدم النشاط ويلبي متطلبات الامتثال الداخلية والخارجية. يدعم أمانًا يتسم بالريادة على مستوى القطاع لحماية بياناتك أثناء النقل وفي أوقات عدم النشاط ومتوافقًا مع متطلبات SOC1 وSOC2 وSOC3 وPCI DSS Level 1. جميع ميزات الأمان والامتثال في Redshift مضمنة بدون أي تكلفة إضافية.

س: كيف يسهِّل Amazon Redshift إدارة مستودع نقل البيانات؟

يُدار Amazon Redshift بالكامل بواسطة AWS، ولذا لا تقلق بشأن مهام إدارة مستودعات البيانات مثل توفير الأجهزة، وتصحيح البرامج، والإعداد، والتكوين، وعُقد المراقبة، ومحركات الأقراص للتعافي من حالات الفشل، أو النُسَخ الاحتياطية. تدير AWS نيابةً عنك العمل اللازم لإعداد مستودع البيانات وتشغيله وتوسعته، وهذا يفرغك للتركيز على بناء تطبيقاتك. كما يحتوي Amazon Redshift على إمكانات الضبط التلقائي، ويقدم توصيات تختص بإدارة مستودعك في Redshift Advisor. في Redshift Spectrum، تُدير Amazon Redshift البنية الأساسية الحوسبية كلها، وموازنة التحميل، والتخطيط، والجدولة، وتنفيذ استعلاماتك على البيانات المخزنة في Amazon S3. يوفر الخيار "بلا خوادم" سعة مستودع البيانات ويوسّع هذه السعة تلقائيًا للحصول على أداء عالٍ لأعباء العمل المتطلبة وغير المتوقعة، ولن تدفع سوى مقابل الموارد التي تستخدمها.

س: كيف تقارن أداء Amazon Redshift بأداء مستودعات البيانات الأخرى؟

تُظهر نتائج المعيار TPC-DS أن Amazon Redshift يوفر أفضل أداء تسعيري حتى في حالة مجموعة البيانات الصغيرة نسبيًا التي سعتها 3 تيرابايت. يوفر Amazon Redshift أداءً تسعيريًا أفضل بمقدار 3 مرات من مستودعات البيانات السحابية الأخرى. وهذا يعني أنه يمكنك الاستفادة من الأداء التسعيري الرائد المتاح في Amazon Redshift من البداية بدون ضبط يدوي. مع Amazon Redshift، يمكنك الحصول على أداء تسعيري أفضل بمقدار 3 مرات من مستودعات البيانات السحابية الأخرى | مدونة AWS Big Data.

يستخدم Amazon Redshift مجموعةً متنوعةً من الابتكارات للوصول إلى سعر أفضل بمقدار 10 مرات من قواعد البيانات التقليدية لمستودعات البيانات وأعباء العمل التحليلية، بما في ذلك تخزين البيانات بتنسيق مضغوط بأعمدة مُحسّن للقراءة مع مجموعات حوسبة المعالجة المتوازية بشكل كبير (MPP) التي تتوسّع خطيًا إلى مئات العُقد. بدلًا من تخزين البيانات على شكل سلسلة من الصفوف، ينظم Amazon Redshift البيانات حسب العمود. عند تحميل البيانات في جدول فارغ، يفحص Amazon Redshift تلقائيًا بياناتك ويحدد نظام الضغط الأنسب.

تتيح لك Redshift Spectrum إمكانية تشغيل الاستعلامات مقابل وحدات إكسابايت من البيانات في Amazon S3. لا يلزم أي عملية تحميل، ولا أي عملية استخراج وتحويل وتحميل (ETL). حتى وإن لم تخزن أي من بياناتك في Amazon Redshift، لا يزال بإمكانك استخدام Redshift Spectrum للاستعلام عن مجموعات بيانات تصل سعة تخزينها إلى وحدات إكسابايت في Amazon S3. توفِّر طرق العرض المادية أداء استعلامات أسرع بشكل كبير في ما يتعلق بأعباء العمل التحليلية المتوقعة والمتكررة مثل لوحات التحكم، والاستعلامات من أدوات ذكاء الأعمال (BI)، ومعالجة بيانات عمليات الاستخراج والتحويل والتحميل (ELT). باستخدام طرق العرض المادية، يمكنك تخزين نتائج الاستعلامات المحوسبة مسبقًا والاحتفاظ بها بفاعلية من خلال معالجة أحدث التغييرات التي تم إجراؤها على الجداول المصدر على نحو متزايد. تقوم الاستعلامات اللاحقة التي تشير إلى طرق العرض المادية باستخدام النتائج المحوسبة مسبقًا للتشغيل بشكل أسرع، وتستخدم إمكانات التحديث التلقائي وإعادة كتابة الاستعلامات لتبسيط استخدام طرق العرض المادية وأتمتها. كما يقوم Amazon Redshift تلقائيًا بإنشاء طرق عرض مادية، ما يوفر نفس مزايا طرق العرض المادية التي ينشئها المستخدم.

تكون سعة الحوسبة والتخزين لمستودعات البيانات المحلية محدودةً بسبب قيود الأجهزة المحلية. يمنحك Amazon Redshift القدرة على توسعة الحوسبة والتخزين حسب الحاجة لتلبية أعباء العمل المتغيرة. مع Redshift Managed Storage (RMS)، تمتلك الآن القدرة على توسعة التخزين إلى وحدات من البيتابايت باستخدام تخزين Amazon S3.

تحسين الجدول التلقائي (ATO) هو عبارة عن إمكانية ضبط ذاتي تساعدك في تحقيق مزايا الأداء لإنشاء مفاتيح الفرز والتوزيع المثالية بدون جهد يدوي. يُراقب تحسين الجدول التلقائي (ATO) كيفية تفاعل الاستعلامات مع الجداول، ويستخدم تعلُّم الآلة (ML) لتحديد أفضل مفاتيح الفرز والتوزيع لتحسين الأداء لأعباء عمل المجموعة. أظهرت تحسينات ATO زيادة أداء المجموعات بنسبة 24% و34% باستخدام معايير TPC-DS ‏‏3 تيرابايت و30 تيرابايت على التوالي، مقارنةً بالمجموعة التي بدون ATO. تلغي الميزات الإضافية مثل الحذف التلقائي للتفريغ، والفرز التلقائي للجداول، والتحليل التلقائي الحاجة إلى الصيانة اليدوية وضبط مجموعات Redshift للحصول على أفضل أداء للمجموعات الجديدة وأعباء العمل الإنتاجية.

تتيح لك إدارة أعباء العمل توجيه الاستعلامات إلى مجموعة من الصفوف المحددة لإدارة التزامن واستخدام الموارد للمجموعات. واليوم، يمتلك Amazon Redshift نوعي التكوين التلقائي واليدوي. باستخدام تكوينات WLM اليدوية، تُصبح مسؤولاً عن تحديد حجم الذاكرة المخصصة لكل صف وأقصى عدد من الصفوف، ويحصل كل منها على جزء من هذه الذاكرة والتي يمكن إدارتها في كل صف من صفوفها. لا تتكيف تكوينات WLM اليدوية مع التغيرات في أعباء عملك وتتطلب معرفةً جديةً باستخدامات موارد الاستعلامات لتحسين الأمر. لا يتطلب Amazon Redshift Auto WLM منك تحديد استخدام الذاكرة أو التزامن للصفوف. وبدلاً من ذلك، يعدل التزامن ديناميكيًا لتحسين معدل النقل. وبشكل اختياري، يمكنك تحديد أولويات الاستعلامات من أجل توفير تخصيص موارد تفضيلي للاستعلامات حسب أولويات أعمالك. كما يوفر Auto WLM أدواتٍ قويةً تمكّنك من إدارة أعباء العمل. تتيح لكأولويات قائمة الانتظار تحديد الأولويات لأعباء العمل حتى يمكنها الحصول على معالجة تفضيلية في Amazon Redshift، بما فيها المزيد من الموارد خلال أوقات الذروة من أجل الحصول على أداء استعلامات متسق وتوفر قواعد مراقبة الاستعلامات طرقًا لإدارة المواقف غير المتوقعة مثل رصد الاستعلامات الجامحة أو باهظة الثمن من استهلاك موارد النظام. في ما يلي مناطق رئيسية من Auto WLM ذات تحسينات أداء متزامنة وتكيفية: تخصيص مناسب للذاكرة، وحذف التقسيم الساكن للذاكرة بين قوائم الانتظار، ومعدل النقل المحسن.

يطوِّر Amazon Redshift Advisor توصيات مُخصَّصة لزيادة الأداء وتحسين التكاليف عن طريق تحليل عبء العمل ومقاييس الاستخدام لمجموعتك. سجّل الدخول إلى وحدة تحكم Amazon Redshift لعرض توصيات Advisor. لمزيد من المعلومات، راجع العمل باستخدام التوصيات من Amazon Redshift Advisor.

س: كيف يمكنني بدء استخدام Amazon Redshift؟

بنقرات قليلة في وحدة إدارة تحكم AWS، يمكنك بدء الاستعلام عن البيانات. يمكنك الاستفادة من عينة مجموعات البيانات مسبقة التحميل، بما فيها مجموعة بيانات المعيار TPC-H وTPC-DS وغيرها من عينات الاستعلامات لبدء التحليلات على الفور. ويمكنك إنشاء مجموعات البيانات والمخططات والجداول وبيانات الحمل من Amazon S3، أو مشاركات بيانات Amazon Redshift، أو تخزينها من نسخة احتياطية موجودة لمجموعة متوفرة من Amazon Redshift. كما يمكنك الاستعلام عن البيانات في تنسيقات مفتوحة مثل Parquet أو ORC في مخزن بيانات Amazon S3، أو الاستعلام عن البيانات في قواعد بيانات تشغيلية مثل Amazon Aurora وAmazon RDS PostgreSQL وMySQL.

لبدء استخدام Amazon Redshift Serverless، اختر "تجربة Amazon Redshift Serverless" وابدأ الاستعلام عن البيانات. يتوسّع Amazon Redshift Serverless تلقائيًا لتلبية أي زيادة في أعباء العمل.

س: هل يمكنني الحصول على المساعدة للتعرف على المزيد حول خدمة Amazon Redshift والالتحاق بها؟

ج: نعم، يتوفر متخصصو Amazon Redshift للإجابة على الأسئلة وتقديم الدعم. اتصل بنا وسيصلك رد منا خلال يوم عمل واحد لمناقشة كيف يمكن أن تساعد AWS مؤسستك.

س: ما المقصود بمسرع الاستعلام المتقدم Advanced Query Accelerator (AQUA) الخاص بـ Amazon Redshift؟/

إن مسرع الاستعلام المتقدم Advanced Query Accelerator (AQUA) هو ذاكرة تخزين مؤقت جديدة مسرعة للأجهزة وموزعة تمكّن Amazon Redshift من العمل بسرعة تزيد عن سرعة أي مستودع بيانات سحابي للمؤسسات آخر بمقدار 10 أضعاف وذلك عن طريق تعزيز بعض أنواع الاستعلامات. يتوفر AQUA مع العقد RA3.16xlarge أوRA3.4xlarge أو RA3.xlplus بدون رسوم إضافية وبدون تغيرات في التعليمة البرمجية.

س: كيف أمكّن/أعطل AQUA لمستودع بيانات Redshift؟

في مجموعات Redshift التي تعمل على عُقد RA3، يُمكنك تمكين/تعطيل AQUA على مستوى المجموعة باستخدام وحدة تحكم Redshift، أو واجهة سطر الأوامر (CLI) في AWS، أو واجهة برمجة التطبيقات (API). في مجموعات Redshift التي تعمل على عُقد DC أو DS أو العُقد الأقدم، يجب عليك الترقية إلى عُقد RA3 أولاً وتمكين/تعطيل AQUA.

س: ما نوع الاستعلامات التي يسرعها AQUA؟

يعمل AQUA على تسريع استعلامات التحليلات عن طريق تشغيل المهام كثيفة البيانات مثل عمليات المسح الضوئي والتصفية والتجميع الأقرب إلى طبقة التخزين. سترى تحسنًا ملحوظًا في أداء الاستعلامات التي تتطلب عمليات مسح ضوئي كبيرة، وخاصةً تلك العمليات التي تتضمن الدوال LIKE وSIMILAR_TO. مع مرور الوقت، ستزداد أنواع الاستعلامات التي يسرعها AQUA.

س: كيف لي أن أعرف الاستعلامات التي يسرعها AQUA على مجموعة Redshift؟

يمكنك الاستعلام عنها في جداول النظام لتطلع على الاستعلامات التي يسرعها AQUA.

س: ما المقصود بالتخزين المُدار من Amazon Redshift؟

يتوفر التخزين المُدار من Amazon Redshift مع أنواع عقد RA3 والعقد بلا خوادم ويتيح لك إمكانية التوسع والدفع مقابل التخزين والحوسبة بشكل مستقل حتى تتمكن من تغيير حجم مجموعتك بناءً على احتياجات الحوسبة فقط. وهو يستخدم تلقائيًا التخزين المحلي المستند إلى محركات الحالة الثابتة عالية الأداء كذاكرة تخزين مؤقت من الطبقة الأولى ويستفيد من التحسينات مثل مقدار كتلة البيانات، وعمر كتلة البيانات، وأنماط عبء العمل لتقديم أداء عالٍ أثناء توسيع التخزين تلقائيًا إلى Amazon S3 عند الحاجة بدون أن يتطلب أي إجراء.

س: كيف أستخدم التخزين المُدار من Amazon Redshift؟

إذا كنت تستخدم بالفعل عُقَد التخزين المكثف Amazon Redshift أو عُقَد الحوسبة المكثفة، فيمكنك استخدام Elastic Resize (تغيير الحجم المرن) لترقية مجموعاتك الحالية إلى مثيل حسابي جديد هو RA3. تقوم Amazon Redshift Serverless والمجموعات التي تستخدم مثيل RA3 تلقائيًا باستخدام التخزين المدار بواسطة Redshift من أجل تخزين البيانات. لا يتطلب أية إجراءات إضافية خارج استخدام مثيلات Amazon Redshift Serverless أو RA3 لاستخدام هذه القدرة.

س: ما المقصود بـ Amazon Redshift Spectrum؟

Amazon Redshift Spectrum هي إحدى ميزات Amazon Redshift حيث تتيح لك تشغيل استعلامات على خلفية مخزن البيانات في خدمة Amazon S3، بدون الحاجة إلى تحميل بيانات أو ETL. عند إصدار استعلام SQL، فإنه ينتقل إلى نقطة نهاية Amazon Redshift، والتي تقوم بإنشاء خطة استعلام وتحسينها. يحدد Amazon Redshift البيانات المحلية وما هو في Amazon S3، ويضع خطةً لتقليل كمية بيانات S3 التي تحتاج إلى قراءة، ويطلب من عمال Amazon Redshift Spectrum الخروج من تجمع الموارد المشترك لقراءة البيانات ومعالجتها من S3.

س: ما الذي ينبغي مراعاته عند استخدام مثيلات RA3؟

فكر في اختيار أنواع عُقَد RA3 في الحالات التالية:

  • تحتاج إلى المرونة في توسع الحوسبة والدفع مقابلها بعيدًا عن التخزين.
  • تستعلم عن جزء من إجمالي بياناتك.
  • يتزايد حجم بيانات بسرعة أو من المتوقع زيادته سريعًا.
  • تريد المرونة لقياس حجم المجموعات بناءً على احتياجات أدائك فقط.

مع استمرار زيادة نطاق البيانات ليصل إلى وحدات من البيتابايت، يزيد أيضًا حجم البيانات التي تستوعبها في مستودع بيانات Amazon Redshift. قد تبحث عن طرق لتحليل جميع بياناتك بطريقة فعالة.

مع مثيلات Amazon Redshift RA3 الجديدة ذات التخزين المُدار، يمكنك اختيار عدد العُقد بناءً على متطلبات أدائك، ولن تدفع إلا مقابل ما تستخدمه من قدرة التخزين المُدار. وهذا يمنحك المرونة في اختيار حجم مجموعة RA3 بناءً على كمية البيانات التي تعالجها يوميًا بدون زيادة تكاليف التخزين. وبناءً على نظام AWS Nitro، تستخدم مثيلات RA3 مع التخزين المُدار محركات حالة ثابتة عالية الأداء في حالة بياناتك النشطة وAmazon S3 في حالة بياناتك غير النشطة، ما يوفر سهولةً في استخدام التخزين فعال التكلفة وسرعة أداء الاستعلامات.

س: متى سأستخدم Amazon Redshift مقابل Amazon RDS؟

يمكّنك كلاً من Amazon Redshift و Amazon Relational Database Service من تشغيل قواعد البيانات العلائقية التقليدية في السحابة وفي الوقت نفسه التخلص من عب إدارة قواعد البيانات. يستخدم العملاء قواعد بيانات Amazon RDS في المقام الأول من أجل أعباء عمل معالجة المعاملات عبر الإنترنت (OLTP)، بينما يتم استخدام Amazon Redshift في المقام الأول لإعداد التقارير والتحليلات. تتطلب أعباء عمل معالجة المعاملات عبر الإنترنت (OLTP) استعلامًا سريعًا عن معلومات محددة، وتتم معالجة دعم معاملات مثل الإدراج والتحديث والحذف بشكل أفضل بواسطة Amazon RDS. يتحكم Amazon Redshift في نطاق وموارد العقد المتعددة ويستخدم مجموعةً متنوعةً من التحسينات لإدخال تحسينات هائلة على قواعد البيانات التقليدية تختص بأعباء عمل التحليلات وإعداد التقارير مقابل مجموعات البيانات الكبيرة للغاية. يوفر Amazon Redshift خيارًا ممتازًا للتوسعة بينما تزداد درجة تعقيد بياناتك واستعلاماتك إذا كنت تريد أن تمنع معالجة إعداد التقارير والتحليلات من التداخل مع أداء عبء عمل OLTP. الآن، مع ميزة الاستعلام المتحد الجديدة، يمكنك الاستعلام عن البيانات بسهولة عبر Amazon RDS الخاص بك أو عبر خدمات قاعدة بيانات Aurora باستخدام Amazon Redshift.

س: متى سأستخدم Amazon Redshift أو Spectrum مقابل Amazon EMR?

يجب أن تستخدم Amazon EMR إذا كنت تستخدم تعليمات برمجية مخصصة لمعالجة وتحليل مجموعات البيانات فائقة الحجم مع أطر عمل معالجة البيانات الكبيرة مثل Apache Spark أو Hadoop أو Presto أو Hbase. يعطيك Amazon EMR إمكانية التحكم الكامل في تكوين مجموعاتك والبرامج التي تقوم بتثبيتها عليها.

تم تصميم مستودعات البيانات مثل Amazon Redshift من أجل نوع مختلف تمامًا من التحليلات. تم تصميم مستودعات البيانات لتجميع البيانات من الكثير من الموارد المختلفة مثل أنظمة المبيعات من المخزون والأنظمة المالية وأنظمة البيع بالتجزئة. لضمان أن إعداد التقارير يتم بشكل دقيق عبر الشركة بالكامل، تقوم مستودعات البيانات بتخزين البيانات بأسلوب عالي التنظيم. يبني هذا الهيكل قواعد تناسق البيانات بشكل مباشر في جداول قاعدة البيانات. تُعد Amazon RedShift هي الخدمة الأفضل للاستخدام عندما تحتاج إلى القيام باستعلامات معقدة على مجموعات ضخمة من البيانات المنظمة وشبه المنظمة وتحصل على أداء سريع.

على الرغم من أن ميزة Redshift Spectrum رائعة لتشغيل الاستعلامات مقابل البيانات الموجودة في Amazon Redshift وS3، فإنها ليست مناسبة تمامًا لأنواع حالات الاستخدام التي تطلبها المؤسسات عادة من معالجة أطر العمل مثل Amazon EMR. يتجاوز Amazon EMR مجرد تشغيل استعلامات SQL. Amazon EMR هي خدمة مُدارة تسمح لك بمعالجة وتحليل مجموعات كبيرة للغاية من البيانات باستخدام الإصدارات الأحدث من أطر عمل معالجة البيانات الكبيرة، مثل Spark وHadoop وPresto، على مجموعات قابلة للتخصيص بالكامل. مع Amazon EMR، يمكنك تشغيل مجموعة متنوعة من مهام معالجة البيانات الموسعة للتطبيقات مثل تعلم الآلة وتحليلات الرسومات وتحويل البيانات وبيانات التدفق وأي شيء يمكنك ترميزه افتراضيًا.

بإمكانك استخدام Redshift Spectrum مع EMR. يستخدم Redshift Spectrum نفس النهج لتخزين تعريفات الجدول كـ Amazon EMR. يستطيع Redshift Spectrum دعم نفس Apache Hive Metastore الذي يستخدمه Amazon EMR لتحديد موقع البيانات وتعريفات الجدول. إذا كنت تستخدم Amazon EMR ولديك Hive Metastore بالفعل، يجب عليك فقط تكوين مجموعة Amazon Redshift الخاصة بك لاستخدامها. بعد ذلك، يمكنك أن تبدأ في الاستعلام عن تلك البيانات مباشرة مع مهام Amazon EMR الخاصة بك. وبالتالي، إذا كنت تستخدم EMR بالفعل لمعالجة مخزن بيانات كبير، يمكنك استخدام Redshift Spectrum للاستعلام عن تلك البيانات في نفس الوقت دون التداخل مع مهام Amazon EMR الخاصة بك.

إن خدمات الاستعلام ومستودعات البيانات وأطر عمل معالجة البيانات المعقدة لها أماكنها، ويتم استخدامها لأغراض مختلفة. أنت فقط تحتاج إلى اختيار الأداة المناسبة للمهمة.

س: متى ينبغي لي استخدام Amazon Athena مقابل Amazon Redshift Spectrum؟

تعدAmazon Athena خدمة استعلام تفاعلية تُسهل عملية تحليل البيانات في Amazon S3 باستخدام SQL القياسي. Athena سهلة الاستخدام. ليس عليك سوى الإشارة إلى بياناتك في S3، وتعريف المخطط، والبدء في الاستعلام باستخدام لغة SQL القياسية.

Redshift Spectrum هي إحدى ميزات Amazon Redshift. إذا كنت بحاجة إلى تحليل البيانات التي يتكرر الوصول إليها باستخدام اتفاقية مستوى الخدمة (SLA) عالية الأداء، فيجب عليك استخدام Amazon Redshift. يُمكنك استخدام Redshift Spectrum لتوسعة نطاق استعلامات Amazon Redshift لتشمل البيانات التي لا يتكرر الوصول إليها كثيرًا في مخزن بيانات Amazon S3 الخاص بك. وهذا يمنحك حرية تخزين بياناتك في المكان الذي تريده بالتنسيق الذي تريده، وجعلها متاحةً للمعالجة عند الحاجة.

س: لماذا ينبغي لي استخدام Amazon Redshift بدلاً من تشغيل مجموعة مستودع بيانات المعالجة الموازية على نطاق واسع (MPP) على Amazon EC2؟

يتناول Amazon Redshift تلقائيًا الكثير من المهام المستهلكة للوقت التي ترتبط بإدارة مستودع البيانات الخاص بك بما في ذلك:
  • الإعداد: مع Amazon Redshift، ستقوم ببساطة بإنشاء مجموعة مستودعات بيانات وتحدد مخططك وتبدأ تحميل بياناتك والاستعلام عنها. لست مضطرًا لإدارة تشغيل الخدمة أو التهيئة أو التصحيح.
  • متانة البيانات: ينسخ Amazon Redshift بياناتك داخل مجموعة مستودع البيانات الخاصة بك ويقوم بعمل نسخًا احتياطيًا لبياناتك إلى Amazon S3، الذي تم تصميمه بمتانة شديدة الدقة. يعكس Amazon Redshift البيانات الخاصة بكل محرك على عقد أخرى داخل مجموعتك. إذا فشل المحرك، ستستمر استعلاماتك مع زيادة بسيطة في زمن الانتقال بينما يقوم Redshift بإعادة بناء المحرك الخاص بك من الاستنساخات. في حالة فشل العقدة، يوفر Amazon Redshift عقدة (عقد) جديدة تلقائيًا ويبدأ في استرجاع البيانات من المحركات الأخرى داخل المجموعة أو من Amazon S3. فهو يعطي الأولوية لاسترجاع البيانات التي يتم الاستعلام عنها باستمرار لتصبح استعلاماتك التي تتم باستمرار ذات جودة بشكل سريع.
  • التحجيم: يمكنك إضافة أو إزالة العقد من مجموعة مستودع بيانات Amazon Redshift عن طريق استدعاء واجهة برمجة تطبيقات واحد أو عبر نقرات قليلة في وحدة إدارة تحكم AWS بما أن السعة والأداء لديك في حاجة للتغيير. يمكنك أيضًا جدولة عمليات التحجيم وتغيير الحجم عن طريق استخدام إمكانية محدد الجدول في Amazon Redshift
  • التحديثات والتصحيحات التلقائية: يطبق Amazon Redshift الترقيات والتصحيحات تلقائيًا بمستودع بياناتك حتى تركز على تطبيقك وليس على إدارته.
  • إمكانية الاستعلام على نطاق الإكسابايت: يتيح لك Amazon Redshift Spectrum إمكانية تشغيل الاستعلامات مقابل إكسابايت البيانات في Amazon S3. لا يلزم إجراء أي تحميل أو خدمة استخراج ونقل وتحميل (ETL). حتى وإن لم تخزن أي من بياناتك في Amazon Redshift، لا يزال بإمكانك استخدام Redshift Spectrum للاستعلام عن مجموعات بيانات تصل سعة تخزينها إلى وحدات إكسابايت في Amazon S3.

س: كيف يمكنني إنشاء مجموعة مستودع بيانات Amazon Redshift والوصول إليها؟

يمكنك بسهولة إنشاء مجموعة مستودع بيانات Amazon Redshift باستخدام وحدة إدارة تحكم AWS أو باستخدام واجهات برمجة تطبيقات Amazon Redshift. يمكنك البدء باستخدام عقدة واحدة ومستودع بيانات بسعة 160 جيجابايت والتوسّع ليصل إلى وحدات من البيتابايت أو أكثر من خلال نقرات قليلة في وحدة تحكم AWS أو استدعاء واجهة برمجة تطبيقات واحد.

يتيح لك تكوين العقدة المفردة، وهو الأنسب لتقييم أو تطوير/اختبار أعباء العمل، البدء في استخدام Amazon Redshift بسرعة وبتكلفة ميسورة، كما يسمح لك بالارتقاء إلى تكوين متعدد العُقَد كلما زادت احتياجاتك. يمكن أن تحتوي مجموعة مستودع بيانات Redshift على عُقد حوسبة من 1-128عُقدة، اعتمادًا على نوع العُقدة. بالنسبة إلى أحدث نوع من العُقدة، RA3، يكون الحد الأدنى لعدد العُقد هو اثنتان. للحصول على التفاصيل، راجع الوثائق.

يتطلب التكوين متعدد العقد وجود عقدة رائدة تتولى إدارة اتصالات العميل وتتلقى الاستعلامات بالإضافة إلى اثنتين من عُقَد الحوسبة تخزنان البيانات وتُجريان الاستعلامات والعمليات الحسابية. يتم توفير العقدة الرائدة، والتي تكون في نفس حجم العقدة الحسابية، لك تلقائيًا ولن يتم تحصيل رسوم منك في مقابلها.

ما عليك سوى تحديد منطقة توافر الخدمات المفضلة (اختياريًا)، وعدد العُقَد، وأنواع، العقد، والاسم الرئيس وكلمة المرور، ومجموعات الأمان وتفضيلاتك للاحتفاظ بالنسخ الاحتياطي وإعدادات النظام الأخرى. بمجرد اختيارك للتكوين الذي تريده، ستوفر Amazon Redshift الموارد المطلوبة وتقوم بإعداد مجموعة مستودع البيانات الخاصة بك.

بمجرد أن تتوفر مجموعة مستودع بياناتك، يُمكنك استرداد نقطة النهاية وسلسلة اتصال JDBC وODBC من وحدة إدارة تحكم AWS أو باستخدام واجهات برمجة تطبيقات Redshift. يمكنك بعد ذلك استخدام سلسلة الاتصال هذه مع أداة قاعدة البيانات المفضلة لديك أو لغة البرمجة أو أداة ذكاء الأعمال (BI). ستحتاج إلى تفويض طلبات الشبكة إلى مجموعة مستودع البيانات في الحالة قيد التشغيل. للحصول على شرح تفصيلي، يُرجى الرجوع إلى دليل بدء الاستخدام.

س: لماذا ينبغي لي استخدام Amazon Redshift Spatial؟

يوفر Amazon Redshift spatial تحليلات قائمةً على الموقع للحصول على رؤى ثرية في بياناتك. حيث تدمج بسهولة البيانات المكانية وبيانات الأعمال لتوفر تحليلات تساهم في اتخاذ القرارات. أطلقت Amazon Redshift دعم معالجة البيانات المكانية الأصلية في نوفمبر 2019، مع هندسة نوع بيانات متعددة الأشكال وعدة وظائف مكانية رئيسة في SQL. والآن ندعم نوع البيانات الهندسية وزاد حجم مكتبتنا من الوظائف المكانية في SQL حتى وصل إلى 80. ندعم جميع أنواع البيانات والمعايير المكانية المشتركة بما فيها Shapefiles وGeoJSON وWKT وWKB وeWKT وeWKB. لمعرفة المزيد، تفضل بزيارة صفحة الوثائق أو صفحة البرامج التعليمية المكانية في Amazon Redshift .

س: ما المقصود بتعزيز أداء الاستعلامات غير النشطة وماذا تفعل Amazon Redshift لتعزيز أداء الاستعلامات غير النشطة؟

يُعالج Amazon Redshift الاستعلامات بطريقة أسرع بمقدار ضعفين مما إذا كانت متراكمة. وتمنحك هذه التحسينات أداء استعلامات أفضل عندما تنشئ مجموعة Redshift جديدة أو تُلحق عبء عمل جديدًا على مجموعة حالية أو بعد تحديث برنامج لمجموعة حالية. تتوفر تحسينات أداء الاستعلامات هذه مجانًا وبدون الحاجة إلى اتخاذ أي إجراء لتمكينها على مجموعاتك.

مع تعزيز أداء الاستعلامات غير النشطة، يتم توسيع تجميعات الاستعلامات إلى خدمة تجميع بلا خوادم تتخطي موارد الحوسبة للعقدة الرائدة في مجموعتك. يدعم Amazon Redshift تخزينًا مؤقتًا غير محدود لتخزين كائنات مجمعة لزيادة نتائج البحث في التخزين المؤقت من 99.60% إلى 99.95%، عند إرسال استعلاماتك المهمة إلى Amazon Redshift.

عند إرسال الاستعلامات إلى Amazon Redshift، يقوم محرك تنفيذ الاستعلامات بتحويل الاستعلام في التعليمة البرمجية للماكينة وتوزيعها على عُقَد المجموعة. تعمل التعليمة البرمجية المجمعة بشكل أسرع لأنها تزيل نفقات استخدام أداة تفسير. في حالة مجموعة جديدة بلا ذاكرة تخزين مؤقت للتعليمات البرمجية أو بعد ترقية مجموعة حالية إلى أحدث إصدار، يتم مسح ذاكرة التخزين المؤقت ويجب تجميع الاستعلامات. ونتيجةً لذلك، قد يتفاوت زمن استجابة أحد الاستعلامات، والذي قد لا يلبي متطلبات بعض أعباء العمل. ومع هذا التحديث، تقلل ذاكرة التخزين المؤقت غير المحدودة من الحاجة إلى تجميع التعليمة البرمجية وعند لزوم التجميع، تقوم مزرعة تجميع قابلة للتوسع بتجميعها بالتوازي لتواكب سرعة أعباء العمل. يعتمد حجم السرعة المتزايدة على مدى تعقيد عبء العمل ومزامنته. لمعرفة المزيد حول تجميع التعليمات البرمجية، راجع معالجة الاستعلامات في دليل مطور قاعدة البيانات.

بلا خوادم

س: ما المقصود بـ Amazon Redshift Serverless (معاينة)؟

Amazon Redshift Serverless (معاينة) هو أحد خيارات Amazon Redshift التي بلا خوادم الذي يسهِّل إجراء التحليلات وتوسيع نطاقها في ثوانٍ بدون الحاجة إلى إعداد البنية الأساسية لمستودع البيانات وإدارتها. مع Redshift Serverless، يستطيع المستخدمون، بمن فيهم محللو البيانات والمطورون ومتخصصو الأعمال وعلماء البيانات، الحصول على الرؤى من البيانات بسهولة عن طريق تحميلها والاستعلام عنها في مستودع البيانات.

س: كيف يمكنني بدء استخدام Amazon Redshift Serverless (معاينة)؟

يُمكنك من خلال بضع نقرات في وحدة إدارة تحكم AWS اختيار "تكوين Amazon Redshift Serverless" وبدء الاستعلام عن البيانات. يُمكنك الاستفادة من عينة مجموعات البيانات محملة مسبقًا مثل بيانات الطقس وبيانات التعداد السكاني ومجموعات بيانات المعايير بالإضافة إلى عينات من الاستعلامات لبدء التحليلات فورًا. ويمكنك إنشاء مجموعات البيانات والمخططات والجداول وبيانات الحمل من Amazon S3، ومشاركات بيانات Amazon Redshift أو استعادتها من نسخة احتياطية موفَّرة حالية من Redshift. كما يمكنك الاستعلام عن البيانات في تنسيقات مفتوحة مثل Parquet أو ORC في مخزن بيانات Amazon S3 أو بيانات الاستعلامات في قواعد بيانات تشغيلية مثل Amazon Aurora وAmazon RDS PostgreSQL وMySQL.

س: ما الإمكانات التي توفرها Amazon Redshift Serverless (معاينة)؟

يوفر Amazon Redshift Serverless العديد من المزايا، ومنها:

  • القدرة على الحصول على رؤى بسرعة بدون توفير مجموعات وإدارتها.
  • التحجيم الذكي والتلقائي القائم على متطلبات أعباء العمل بدون الحاجة إلى موارد أكثر من المتوفر.
  • التوافر المستمر للخدمة للتمتع بالتحجيم وتحديثات الإصدارات.
  • أداء استعلامات سريع وابتكاري للبيانات المحملة في مستودع البيانات، وتنسيقات مفتوحة في مخزن بيانات Amazon S3، وكذلك البيانات في قواعد البيانات التشغيلية بدون الحاجة إلى ضبط قاعدة البيانات.
  • تحليلات SQL الغنية، والمتانة، وضمانات Amazon Redshift المتعلقة بالمعاملات.
  • الفعالية من حيث التكلفة عن طريق الدفع مقابل السعة المستخدمة فقط وتقليل تعقيد مستودع البيانات.

س: ما مزايا استخدام Amazon Redshift Serverless (معاينة)؟

إذا لم يكن لديك خبرة في إدارة مستودع البيانات، فلا تقلق بشأن إعداد المجموعات أو تكوينها أو إدارتها أو ضبط المستودع. يمكنك التركيز على استخلاص رؤى مفيدة من بياناتك أو تقديم نتائج أعمال أساسية من خلال البيانات. ولا تدفع سوى مقابل ما تستخدمه لتتمكن من إدارة التكاليف. تستمر في الاستفادة من أداء Amazon Redshift العالي وميزات SQL المتميزة، والتكامل السلس مع مخازن البيانات ومستودعات البيانات التشغيلية والتحليلات التنبؤية المدمجة وإمكانات مشاركة البيانات. إذا كنت بحاجة إلى تحكم دقيق في مستودع بياناتك، يمكنك توفير مجموعات Redshift.

س: كيف يعمل Amazon Redshift Serverless (معاينة) مع خدمات AWS الأخرى؟

يُمكنك الاستمرار في استخدام جميع وظائف التحليلات المتميزة المتاحة في Amazon Redshift مثل الصلات المعقدة، والاستعلامات المباشرة عن البيانات في مخزن بيانات Amazon S3 وقواعد البيانات التشغيلية، وطرق العرض المادية، والإجراءات المخزنة، ودعم البيانات شبه المهيكلة، والتعلم الآلي، وكذلك الأداء العالي على نطاق واسع. إن كل الخدمات ذات الصلة التي يتكامل معها Amazon Redshift (مثل Amazon Kinesis، وAWS Lambda، وAmazon QuickSight، وAmazon SageMaker، وAmazon EMR، وAWS Lake Formation، وAWS Glue) تستمر في العمل مع Amazon Redshift Serverless.

س: ما حالات الاستخدام التي يمكنني معالجتها باستخدام Amazon Redshift Serverless (معاينة)؟

يمكنك الاستمرار في إدارة كل حالات الاستخدام التحليلية. بفضل بساطة سير عمل بدء الاستخدام، والتحجيم التلقائي، وإمكانية الدفع مقابل الاستخدام، تجعل تجرية Amazon Redshift Serverless الآن تشغيل إدارة بيئات التطوير والاختبار أكثر سهولةً وأكثر فعالية من حيث التكلفة وهذه البيئات تحتاج إلى سرعة البدء، وتحليلات عمل مخصصة، وأعباء العمل ذات احتياجات حوسبة متنوعة وغير متوقعة، وأعباء عمل متقطعة أو متفرقة.

س: كيف يختلف Amazon Athena عن Amazon Redshift Serverless؟

يختلف Amazon Athena عن Amazon Redshift في الاحتياجات وفي حالات الاستخدام، حتى وإن كانت كلتا الخدمتين بلا خوادم. يُعتبر مستودع البيانات Amazon Redshift هو أفضل خيار إذا كنت بحاجة إلى أفضل أداء تسعيري لأعباء العمل المعقدة التي تختص بذكاء الأعمال والتحليلات والتي تتطلب أداءً عاليًا على أي نطاق. كما توفر Amazon Redshift إمكانية الاستعلامات عن البيانات المخزنة في Amazon S3 ودمجها مع البيانات المخزنة في مستودع البيانات. وبالمقارنة، يبدو أن Athena تناسب أكثر التحليلات التفاعلية في أي مخزن بيانات بدون القلق بشأن استيعاب البيانات وتنسيقها. تحليل Athena منفصل عن التخزين، حيث يمنحك مرونة استخدام أدوات وخدمات أخرى مثل Spark وFlink وKafka من أجل إثراء التحليل ومعالجة البيانات على نفس البيانات التي يحللها Athena.

مشاركة البيانات

س: ما المقصود بمشاركة بيانات Amazon Redshift؟

تتيح لكمشاركة بيانات Amazon Redshift مشاركة البيانات المباشرة في Amazon Redshift من أجل مشاركة آمنة وسهلة للبيانات لأغراض القراءة مع مجموعات Redshift الأخرى داخل حسابات AWS وبينها ومع خدمات AWS التحليلية باستخدام مخزن البيانات. مع مشاركة البيانات، يُمكنك على الفور الاستعلام عن بيانات مباشرة من أي من مجموعات Redshift طالما أن لديها أذونات لإمكانية الوصول بدون التعقيدات والتأخيرات المرتبطة بنُسَخ البيانات وحركة البيانات. يتيح لك Amazon Redshift مشاركة البيانات المباشرة والاستعلام عنها عبر المؤسسة، والحسابات، والمناطق.

س: ما حالات استخدام مشاركة البيانات؟

تتضمن حالة الاستخدام الرئيسة ما يلي:

  • مجموعة ETL مركزية تُجري مشاركةً للبيانات مع العديد من مجموعات ذكاء الأعمال/التحليلات لتوفير عزل أعباء عمل القراءة وإمكانية الشحن الاختيارية.
  • موفر بيانات يُجري مشاركةً للبيانات إلى مستهلكين خارجيين.
  • مشاركة مجموعات بيانات مشتركة مثل العملاء والمنتجات عبر مجموعات الأعمال المختلفة والتعاون من أجل توسعة التحليلات وعلوم البيانات.
  • تحقيق لامركزية مستودع البيانات من أجل تبسيط الإدارة.
  • مشاركة البيانات بين بيئات التطوير والاختبار والإنتاج.
  • الوصول إلى بيانات Redshift من خدمات AWS التحليلية الأخرى.

س: ما استعلامات قاعدة البيانات المشتركة في Amazon Redshift؟

باستخدام الاستعلامات عبر قواعد البيانات، يُمكنك الاستعلام بسهولة عن البيانات وضمها من أي قاعدة بيانات Redshift لديك حق الوصول إليها، بغض النظر عن قاعدة البيانات التي تتصل بها. يمكن أن يشمل ذلك قواعد البيانات المحلية على المجموعة وكذلك مجموعات البيانات المشتركة التي تتوفر من المجموعات البعيدة. تمنحك الاستعلامات عبر قواعد البيانات المرونة لتنظيم البيانات كقواعد بيانات منفصلة لدعم التكوينات متعددة المستأجرين.

س: ما المقصود بـ AWS Data Exchange for Amazon Redshift؟

يتيح لك AWS Data Exchange for Amazon Redshift العثور على بيانات الأطراف الخارجية والاشتراك فيها في AWS Data Exchange الذي فيه يمكنك الاستعلام عن مستودع بيانات Redshift خلال دقائق. كما يمكنك ترخيص بياناتك بسهولة في Amazon Redshift من خلال AWS Data Exchange. تُمنَح إمكانية الوصول تلقائيًا عندما يشترك العميل في بياناتك وتُلغَى تلقائيًا عندما ينتهي الاشتراك، وتُنشأ الفواتير تلقائيًا وتُجمَّع المدفوعات تلقائيًا وتُصرف من خلال AWS. تمنحك هذه الميزة إمكانية الاستعلام بسرعة وبناء التطبيقات باستخدام بيانات الأطراف الخارجية.

س: من المستخدمون الأساسيون لخدمة AWS Data Exchange؟

تجعل AWS Data Exchange من السهل على عملاء AWS تبادل بيانات الأطراف الخارجية واستخدامها بأمان في AWS. يود محللو البيانات، ومديرو المنتجات، ومديرو قوائم المشروعات، وعلماء البيانات، وعلماء البيانات الكمية، وفنيو التجارب السريرية، والمطورون تقريبًا في كل مجال الوصول إلى المزيد من البيانات لتحسين التحليلات، وتدريب نماذج التعلم الآلي، واتخاذ قرارات مستندة إلى البيانات. ولكن لا يوجد مكان واحد تعثر فيه على بيانات من عدة موفرين ولا يوجد تناسق في كيف يوصل الموفرون البيانات، وبالتالي يتم تركها مع مجموعة من الوسائط المادية المشحونة، وبيانات اعتماد بروتوكول نقل الملفات (FTP)، واستدعاءات واجهة برمجة التطبيقات (API) للحلول. وفي المقابل، تود العديد من المؤسسات جعل البيانات متاحةً لأغراض بحثية أو تجارية ولكن من الصعب جدًا والمكلف القيام ببناء تقنية تختص بتوصيل البيانات واستحقاقها وإصدار الفواتير والحفاظ على هذه التقنية والذي من شأنه إزالة الضغط الناجم عن إمداد البيانات القيّمة.

س: أي من مناطق AWS يتوفر فيها AWS Data Exchange؟

تحتوي AWS Data Exchange على دليل منتجات واحد متاح عالميًا ويوفره مقدمو الخدمات. ويمكنك الاطلاع على الدليل بغض النظر عن المنطقة التي تستخدمها أنت. تعتبر الموارد الكامنة في المنتج (مجموعات البيانات، والمراجعات، والأصول) موارد إقليمية يمكنك إدارتها بالبرامج أو من خلال وحدة تحكم AWS Data Exchange في منطقة معينة من مناطق AWS. راجع الجدول توافر AWS الإقليمي للحصول على قائمة بمناطق AWS التي تتوفر بها حاليًا خدمة AWS Data Exchange.

س: ما الفرق بين AWS Data Exchange وRegistry of Open Data on AWS (سجل البيانات المفتوحة على AWS)؟

هناك خمسة فروق أساسية بين AWS Data Exchange وRegistry of Open Data on AWS (سجل البيانات المفتوحة على AWS):

  • أولاً: تدعم AWS Data Exchange كلاً من منتجات البيانات المجانية والتجارية، مع أي رسوم تجارية مطبقة على فاتورة AWS الخاصة بك. يمنحك Registry of Open Data on AWS (سجل البيانات المفتوحة على AWS) إمكانية وصول إلى قائمة منسقة من مجموعات البيانات المجانية والمفتوحة. 
  • ثانيًا، تتطلب AWS Data Exchange منك الموافقة الصريحة على اتفاقية اشتراك البيانات التي تضم البنود التي حددها مقدم البيانات عند نشر منتجه. لا تشتمل البيانات الواردة في Registry of Open Data on AWS (سجل البيانات المفتوحة على AWS) على شروط للاستخدام. 
  • ثالثًا: يجب عليك استخدام واجهة برمجة تطبيقات AWS Data Exchange لنسخ البيانات من AWS Data Exchange إلى موقعك المطلوب على Amazon S3. يمكن الوصول إلى مجموعات بيانات Registry of Open Data on AWS (سجل البيانات المفتوحة على AWS) من خلال واجهات برمجة تطبيقات S3. 
  • رابعًا، تقدم AWS Data Exchange لمقدمي البيانات إمكانية الوصول إلى نشاط اشتراك بتقارير تفصيلية يومية وأسبوعية وشهرية. وباستخدام Registry of Open Data on AWS (سجل البيانات المفتوحة على AWS)، يجب على مقدمي البيانات تحليل سجلاتهم لتتبع استخدام البيانات. 
  • وأخيرًا، لتصبح مقدم بيانات على AWS Data Exchange، يجب على العملاء المؤهلين أن يسجلوا كأحد مقدمي البيانات على AWS Marketplace ليكونوا مؤهلين لإدراج المنتجات المجانية والتجارية على حدٍ سواء. ومع ذلك، يُمكن لأي عميل إضافة بيانات مجانية إلى Registry of Open Data on AWS (سجل البيانات المفتوحة على AWS) من خلال GitHub وقد ينطبق على برنامج AWS Public Dataset Program كي تقوم AWS بدعم تكاليف التخزين وعرض النطاق لتحديد مجموعة البيانات المفتوحة.

س: ما المقصود بـ Amazon Redshift Query Editor الإصدار 2؟

إن Amazon Redshift Query Editor v2 هو تطبيق عميل SQL قائم على الويب يمكنك استخدامه في صياغة الاستعلامات وتشغيلها على مستودع بيانات Redshift. ويمكنك عرض نتائج الاستعلامات في صورة مرئية باستخدام مخططات والتعاون من خلال مشاركة الاستعلامات مع أعضاء فريقك. يوفر Query Editor v2 إمكانات عديدة مثل القدرة على تصفح واستكشاف العديد من قواعد البيانات، والجداول الخارجية، وطرق العرض، والإجراءات المخزنة، والوظائف معرّفة المستخدم. حيث يوفر معالجةً لإنشاء مخططات، وجداول، ووظائف معرّفة المستخدم. كما يمكنك تحميل البيانات في Amazon Redshift من Amazon S3 باستخدام معالج بصري. ويبسط إدارة الاستعلامات المحفوظة والتعاون فيها. كما يمكنك الحصول على رؤىً أسرع عن طريق تصور النتائج بنقرة واحدة. ومع آخر إصدارات المعاينة، يمكن لمحللي البيانات مشاركة استعلاماتهم والتعاون فيها من خلال واجهة مشتركة تسمى Query Doc التي تتيح لهم تضمين استعلامات التعليمات البرمجية/استعلامات SQL، والتعليقات، والنتائج، والتصورات.

س: لماذا ينبغي لي استخدام Query Editor V2؟

إذا كنت أحد محللي البيانات أو علماء البيانات، أو مهندسي البيانات، فيمكنك الآن استخدام Query Editor V2 في التصفح، وإنشاء المخططات والجداول، وتحميل البيانات، وصياغة استعلامات SQL والإجراءات المخزنة ووظائف تعريف المستخدم (UDF) من خلال واجهة قائمة على الويب. كما يمكنك إجراء تحليل بصري للبيانات الموجودة بدون الحاجة لمغادرة الأداة. ويمكنك أيضًا جدولة الاستعلامات طويلة المدة أو الاستعلامات المصممة لأغراض الإبلاغ البسيطة مثل الإبلاغ اليومي.

س: ما المزايا المتضمنة في Query Editor v2؟

يتيح لك Query Editor v2 ما يلي:

  • إنشاء مخططات وجداول وتحميل البيانات بطرقة مرئية من Amazon S3.
  • صياغة الاستعلامات والحصول على رؤى أسرع باستخدام محرر ذكي من أجل صياغة استعلامات SQL.
  • إجراء تحليل النتائج وتنزيل النتائج في تنسيق JSON/CSV على سطح المكتب.
  • إدارة تلقائية للإصدارات المختلفة من الاستعلامات.
  • التعاون مع المستخدمين الآخرين لمشاركة الاستعلامات والتحليلات والنتائج.
  • تشغيل الاستعلامات في الخلفية حتى وإن كان المتصفح مغلقًا.

قابلية التوسع والتزامن

س: كيف يمكنني زيادة حجم وأداء مجموعة مستودع بيانات Amazon Redshift؟

إذا كنت ترغب في زيادة أداء الاستعلام أو الاستجابة للاستخدام المفرط لوحدة المعالجة المركزية أو الذاكرة أو المدخلات/المخرجات، يمكنك زيادة عدد العُقَد داخل مجموعة مستودع البيانات باستخدام Elastic Resize من خلال وحدة إدارة تحكم AWS أو واجهة برمجة تطبيقات ModifyCluster. عندما تُعدّل مجموعة مستودع البيانات، يتم فورًا تطبيق التغييرات التي تطلبها. تتوفر قياسات استخدام الحوسبة، واستخدام التخزين، وحركة مرور القراءة/الكتابة إلى مجموعة مستودع بيانات Redshift مجانًا عبر وحدة إدارة تحكم AWS أو واجهات برمجة تطبيقات Amazon CloudWatch. يمكنك كذلك إضافة قياسات مُعرَّفة المستخدم عبر وظيفة القياسات المخصصة Amazon CloudWatch.

ومن خلال ميزة ضبط النطاق المتزامن، يمكنك دعم المستخدمين المتزامنين والاستعلامات المتزامنة غير المحدودة ظاهريًا، من خلال أداء الاستعلامات الذي يتسم بالسرعة الدائمة. عندما يتم تمكين ميزة ضبط النطاق المتزامن، يقوم Amazon Redshift بإضافة سعة إلى المجموعة عندما تزيد تجارب المجموعات في قائمة انتظار الاستعلامات.

ومع Amazon Redshift Spectrum، يمكنك تشغيل مجموعات Redshift متعددة تصل إلى نفس البيانات في Amazon S3. ويمكنك استخدام مجموعات مختلفة لحالات استخدام مختلفة. على سبيل المثال، يمكنك استخدام مجموعة للتقارير القياسية وأخرى لاستعلامات علوم البيانات. ويمكن أن يستخدم فريق التسويق مجموعاته المختلفة عن مجموعات فريق العمليات. تقوم Redshift Spectrum تلقائيًا بتوزيع تنفيذ الاستعلام على عدة عمال Redshift Spectrum من مجموعة موارد مشتركة لقراءة البيانات ومعالجتها من Amazon S3، كما أنه يسحب النتائج مرةً أخرى إلى مجموعة Redshift من أجل إجراء أي عمليات معالجة متبقية.

س: هل تبقى مجموعة مستودع البيانات متاحةً أثناء التحجيم؟

الأمر يتوقف على عدة أشياء. عندما تستخدم ميزة ضبط النطاق المتزامن، تكون المجموعة متاحة بشكل كامل للقراءة والكتابة أثناء ضبط النطاق المتزامن. مع Elastic Resize، لا تكون المجموعة متاحةً لمدة أربع إلى ثمان دقائق والتي تمثل فترة تغيير الحجم. بفضل مرونة تخزين Redshift RA3 في التخزين المُدار، تكون المجموعة متاحةً بصفة كاملة وتنتقل البيانات بشكل تلقائي بين عُقد التخزين المُدار وعُقد الحوسبة.

س: متى ينبغي لي استخدام ميزة ضبط النطاق المتزامن ومتى ينبغي لي استخدام مشاركة البيانات؟

تُعد ميزة مشاركة البيانات وميزة ضبط النطاق المتزامن من الميزات التكميلية. باستخدام ميزة ضبط النطاق المتزامن، يسمح لك Amazon Redshift بالتدرج التلقائي في عبء عمل واحد أو أكثر في مجموعة واحدة للتعامل مع الزيادة في التزامن والاستعلام. يؤدي النقل باستخدام Amazon Redshift بمرونة وتلقائية إلى زيادة السعة في ثوانٍ للتعامل مع اندفاعات نشاط المستخدم وتقليلها عندما ينحسر النشاط. تستمر التطبيقات في التفاعل مع Amazon Redshift باستخدام نقطة نهاية تطبيق واحدة. تُتيح لك مشاركة البيانات توسيع نطاق أعباء العمل المتنوعة من خلال عمليات النشر متعددة المجموعات والحسابات. وهذا من شأنه أن يتيح لك عزل عبء العمل والقدرة على الشحن والتعاون بين المجموعات في بيئات غير مركزية والقدرة على تقديم البيانات كخدمة لأصحاب المصلحة الداخليين والخارجيين. يمكنك تمكين ميزة ضبط النطاق المتزامن على كل من مجموعات المنتجين ومجموعات المستهلكين التي تقوم بمشاركة البيانات.

س: كيف يمكنني إدارة الموارد للتحقق من أن مجموعة Amazon Redshift توفر الأداء السريع بصفة دائمة أثناء الفترات عالية التزامن؟

يكون لمستودعات البيانات النموذجية تنوع ضخم في الاستخدام المتزامن للاستعلامات على مدار اليوم. وتكون إضافة الموارد خلال الفترة التي تكون ضرورية خلالها أكثر فاعلية من ناحية التكلفة من التوفير لطلب الذروة. ويتعامل Amazon Redshift مع ذلك بشكل تلقائي نيابةً عنك.

ضبط النطاق المتزامن هو ميزة في Amazon Redshift توفر أداءً سريعًا وثابتًا للاستعلام حتى خلال الآلاف من الاستعلامات المتزامنة. ومن خلال هذه الميزة، يقوم Amazon Redshift بإضافة القدرات العابرة بشكل تلقائي عند الحاجة إلى ذلك من أجل التعامل مع الطلب الشديد. ويقوم Amazon Redshift بشكل تلقائي بتوجيه الاستعلامات إلى مجموعات توسيع النطاق، والتي يتم توفيرها خلال ثواني، حيث يتم بدء معالجة الاستعلامات بشكل فوري.

وهذه الميزة مجانية لأغلب العملاء. تحقق كل مجموعة من مجموعات Amazon Redshift ما يقرب من ساعة من أرصدة ضبط النطاق المتزامن المجاني في اليوم. ويوفر ذلك إمكانية التوقع في التكاليف الشهرية الخاصة بك، حتى أثناء فترات الطلب التحليلي المتذبذب.

س: ما المقصود بـ Elastic Resize وكيف يكون مختلفًا عن ضبط النطاق المتزامن؟

يقوم Elastic Resize بإضافة أو إزالة العُقد من مجموعة Redshift واحدة خلال دقائق لإدارة معدل نقل الاستعلامات الخاصة بها. على سبيل المثال، قد يحتاج عبء عمل ETL لساعات معينة في تقارير نهاية اليوم أو الشهر إلى موارد Amazon Redshift إضافية من أجل إتمامها في الوقت المناسب. تضيف ميزة ضبط النطاق المتزامن المزيد من موارد المجموعة الإضافية من أجل زيادة إجمالي تزامن الاستعلامات.

س: هل يمكنني الوصول إلى مجموعات ضبط النطاق المتزامن بشكل مباشر؟

لا. فضبط النطاق المتزامن عبارة عن مجموعة قابلة للتوسع بشدة من موارد Amazon Redshift، ولا يحظى العملاء بإمكانية الوصول إليها بشكل مباشر.

تكامل البيانات وتحميلها

س: كيف أقوم بتحميل البيانات على مستودع بيانات Amazon Redshift الخاص بي؟

يمكنك تحميل البيانات إلى Amazon Redshift من مجموعة من مصادر البيانات بما في ذلك Amazon S3, وAmazon RDS وAmazon DynamoDB, وAmazon EMR, وAWS Glue, AWS Data Pipeline أو أي مضيف يدعم SSH على Amazon EC2 أو في الموقع. يحاول Amazon Redshift تحميل بياناتك بشكل موازي لكل عقدة حسابية لزيادة السعر الذي يتم عنده استيعاب البيانات داخل مجموعة مستودع البيانات الخاصة بك. يستطيع العملاء الاتصال بـ Amazon Redshift باستخدام ODBC أو JDBC ونشر أوامر 'إدخال' SQL لإدخال البيانات. يُرجى ملاحظة أن هذا أبطأ من استخدام S3 أو DynamoDB لأن هذه الطرق تقوم بتحميل البيانات بشكل موازي لكل عقدة حسابية بينما يقوم SQL بإدخال حمل العبارات عبر العقدة الرائدة الوحيدة. لمزيد من التفاصيل حول تحميل البيانات إلى Amazon Redshift، يرجى عرض دليل بدء الاستخدام الخاص بنا.

س: كيف أقوم بتحميل بيانات Amazon RDS وAmazon EMR وAmazon DynamoDB وAmazon EC2 الخاصة بي إلى Amazon Redshift؟

يمكنك استخدام أمر COPY لتحميل البيانات بالتوازي مباشرةً إلى Amazon Redshift من Amazon EMR أو Amazon DynamoDB أو أي مضيف ممكّن عليه SSH. يمكّنك Amazon Redshift Spectrum أيضًا من تحميل البيانات من Amazon S3 إلى مجموعتك باستخدام أمر INSERT INTO البسيط. فد يمكّنك هذا من تحميل البيانات من تنسيقات مختلفة مثل Parquet وORC إلى مجموعتك. لاحظ أنك إذا استخدمت هذا النهج، فستتحمل رسوم Redshift Spectrum مقابل البيانات الممسوحة ضوئيًا من Amazon S3. 

توفر AWS Data Pipeline حلاً يتسم بالأداء العالي والموثوقية وتحمل الأخطاء وهذا الحل يختص بتحميل البيانات من مجموعة متنوعة من مصادر البيانات في AWS مثل Amazon RDS إلى Redshift. يُمكنك استخدام AWS Data Pipeline لتحديد مصدر البيانات وتحويلات البيانات المطلوبة، ثم تشغيل برنامج نصي مسبق الكتابة لتحميل بياناتك إلى Amazon Redshift. بالإضافة إلى ذلك، فإن AWS Glue هي خدمة استخراج وتحويل وتحميل (ETL) مُدارة بالكامل، تسهِّل إعداد البيانات وتحميلها للتحليلات. يمكنك إنشاء مهمة AWS Glue ETL وتشغيلها بنقرات قليلة في وحدة إدارة تحكم AWS. بالإضافة إلى ذلك، فإن العديد من شركات ETL اعتمدت استخدام Amazon Redshift مع أدواتها، كما أن مجموعة من تلك الشركات توفر نسخًا تجريبية مجانية لمساعدتك في بدء تحميل بياناتك. كما نفذت بعض هذه المزايا تكاملاً أعمق مع وحدة تحكم Redshift لتسهيل استكشاف ومراقبة مسارات البيانات في Amazon Redshift من مجموعة كبيرة ومتنوعة من مصادر الأطراف الخارجية.

س: لدي الكثير من البيانات أرغب في تحميلها بشكل مبدئي في Amazon Redshift. يمكن أن يستغرق النقل عبر الإنترنت فترة زمنية طويلة. كيف يمكنني تحميل تلك البيانات؟

يمكنك استخدام AWS Snowball لنقل البيانات إلى Amazon S3 باستخدام أجهزة التخزين القابلة للنقل. بالإضافة إلى ذلك، يمكنك استخدام AWS Direct Connect لإنشاء اتصال شبكي خاص بين شبكتك أو مركز البيانات وAWS. يمكنك اختيار منافذ اتصال 1 جيجابت في الثانية أو 10 جيجابت في الثانية لنقل البيانات الخاصة بك.

الأمان

س: كيف يحافظ Amazon Redshift على أمان بياناتي؟

يدعم Amazon Redshift الأمان الرائد في المجال بجانب تكامل AWS IAM المدمج، واتحاد الهويات من أجل تسجيل دخول الأحادي، والمصادقة متعددة العوامل، والتحكم في الوصول على مستوى العمود، والأمان على مستوى الصف، وAmazon Virtual Private Cloud (Amazon VPC)، وتوفر تكامل AWS KMS المدمج لحماية بياناتك أثناء النقل وفي حالة عدم النشاط. يقوم Amazon Redshift بتشفير البيانات والحفاظ على أمانها أثناء النقل وأثناء عدم النشاط باستخدام أساليب تشفير قياسية في المجال. للحفاظ على أمان البيانات أثناء نقلها، يدعم Amazon Redshift الاتصالات التي تعتمد على SSL بين تطبيق العميل لديك ومجموعة مستودع بيانات Redshift. للحفاظ على أمان البيانات الخاصة بك أثناء تخزينها، يقوم Amazon Redshift بتشفير كل كتلة باستخدام تشفير AES-256 المعتمد على تسريع الأجهزة أثناء كتابتها على القرص. ويحدث ذلك بمستوى منخفض في النظام الفرعي للإدخال / الإخراج، حيث يتم تشفير كل شيء مكتوب على القرص، بما في ذلك نتائج الاستعلام الوسيطة. ويتم عمل النسخ الاحتياطي للكتل كما هي، ما يعني أنه يتم تشفير النسخ الاحتياطية كذلك. وبشكل افتراضي، تهتم Amazon Redshift بإدارة المفاتيح، ولكن يمكنك اختيار إدارة مفاتيحك باستخدام AWS Key Management Service. يتم تقديم جميع ميزات أمان Amazon Redshift دون أي تكاليف إضافية. يدعم Redshift Spectrum تشفير جانب الخادم (SSE) لـ Amazon S3، باستخدام المفتاح الافتراضي للحساب الخاص بك والذي تتم إدارته من خلال AWS Key Management Service (KMS).

س: هل يدعم Redshift عناصر التحكم في الوصول متعددة المستويات مثل الأمان على مستوى الأعمدة؟

نعم، يوفر Amazon Redshift الدعم للتحكم في الوصول القائم على الدور. التحكم في الوصول على مستوى الصف يسمح لك بتعيين دور واحد أو أكثر من دور لمستخدم، وتعيين امتيازات النظام وامتيازات الكائنات حسب الدور. يُمكنك استخدام أدوار نظام مبتكرة؛ المستخدم الرئيسي، وdba، والمشغل، ومسؤولو الأمان، أو إنشاء الأدوار الخاصة بك.

س: هل تدعم Amazon Redshift إخفاء البيانات أو ترميز البيانات؟

تمكّنك وظائف AWS Lambda المُعرفة من قِبل المستخدم (UDFs) من استخدام وظيفة AWS Lambda باعتبارها وظيفة مُعرفة من قِبل المستخدم في Amazon Redshift واستدعائها من استعلامات Redshift SQL. تمكّنك هذه الوظيفة من كتابة ملحقات مُخصَّصة لاستعلام SQL لتحقيق تكامل أكثر إحكامًا مع الخدمات الأخرى أو منتجات الأطراف الخارجية. يُمكنك كتابة وظائف Lambda المُعرفة من قِبل المستخدم لتمكين الترميز الخارجي، وإخفاء البيانات، والتعرف على البيانات أو إلغاء التعرف عليها من خلال التكامل مع موردين مثل Protegrity، وحماية البيانات الحساسة أو إلغاء حمايتها بناءً على أذونات المستخدم ومجموعات المستخدم، في وقت الاستعلام.

س: هل يدعم Amazon Redshift تسجيل الدخول الأحادي؟

نعم. يمكن للعملاء الذين يرغبون في استخدام موفري هوية المؤسسة مثل Microsoft Azure Active Directory أو Active Directory Federation Services أو Okta أو Ping Federate أو موفري هوية آخرين متوافقين مع SAML تكوين Amazon Redshift لتقديم تسجيل الدخول الأحادي.

س: كيف يدعم Amazon Redshift تسجيل الدخول الأحادي باستخدام Microsoft Azure Active Directory؟

يمكنك تسجيل الدخول إلى مجموعة Amazon Redshift باستخدام هويات Microsoft Azure Active Directory (AD). يتيح هذا لك القدرة على تسجيل الدخول إلى Redshift دون تكرار هويات Azure Active Directory في Redshift.

س: هل تدعم Amazon Redshift multi-factor authentication (MFA)?

نعم. يمكنك استخدام multi-factor authentication (MFA) للحصول على أمان إضافي عند المصادقة مع مجموعة Amazon Redshift الخاصة بك.

س: هل يمكنني استخدام Amazon Redshift في Amazon Virtual Private Cloud (Amazon VPC)؟

نعم. يمكنك استخدام Amazon Redshift كجزء من تكوين VPC لديك. من خلال Amazon VPC، يمكنك تحديد مخطط الشبكة الظاهرية التي تشبه إلى حد كبير الشبكة التقليدية التي يمكن أن تقوم بتشغيلها في مركز بياناتك. ويمنحك ذلك السيطرة الكاملة على من يمكنه الوصول إلى مجموعة مستودع بيانات Redshift. ويمكنك استخدام Redshift Spectrum مع مجموعة Redshift والتي تعد جزءًا من Amazon VPC لديك.

يدعم Amazon Redshift نقاط نهاية VPC المدارة (وتعمل بواسطة AWS PrivateLink) للاتصال بمجموعة Redshift في VPC. وباستخدام إحدى نقاط النهاية المدارة بواسطة Amazon Redshift، يمكنك الوصول بشكل خاص إلى مستودع بيانات Redshift خلال سحابة VPC الخاصة بك من تطبيقات عميلك في سحابة VPC أخرى داخل نفس حساب AWS أو حساب آخر ويعمل في الموقع بدون استخدام عناوين IP عامة أو المطالبة بحركة مرور تجتاز الإنترنت.

س: هل يمكنني الوصول إلى عُقَد حوسبة Amazon Redshift بشكل مباشر؟

لا. تتواجد عقد حوسبة Amazon Redshift الخاصة بك في مساحة شبكة خاصة، ولا يمكن الوصول إليها من عقدة قيادة مجموعة مستودع البيانات الخاصة بك. هذا يوفر طبقة أمان إضافية لبياناتك.

س: هل يدعم Redshift التحكم في الوصول القائم على الدور في قاعدة البيانات؟ (الإعلانات المسبقة)

يوفر Amazon Redshift الدعم للتحكم في الوصول القائم على الدور قريبًا.

التوافر الدائم والمتانة

س: ماذا يحدث لتوافر مجموعة مستودع البيانات ومتانة البيانات إذا فشل أحد محركات الأقراص الموجودة في العُقد؟

يرصد Amazon Redshift الفشل في المحرك أو العقدة في هذه الحالات ويستبدل عقدة المجموعة تلقائيًا. وفي مجموعات الحوسبة المكثفة (DC) والتخزين المكثف (DS2)، تُخزَّن البيانات على عُقَد الحوسبة لضمان متانة عالية للبيانات. وعند استبدال إحدى العُقَد، يتم تحديث البيانات من النسخة المعكوسة على العقدة الأخرى.

لا تتأثر مجموعات RA3 وRedshift serverless بنفس الطريقة لأن البيانات مخزنة في Amazon S3 ويُستخدم المحرك المحلي كمخزن مؤقت للبيانات فقط. وفي حالة استبدال العقدة، يتم استعادة البيانات من Amazon S3. يوفر Amazon S3 متانةً للبيانات تصل إلى 99.9999%. وفي حالة فشل مجموعة متعددة العُقَد أو مجموعة كاملة، تتوفر نسخة محدثة من البيانات في S3 ويمكن استعادة المجموعة في نفس منطقة توافر الخدمات (AZ) أو في منطقة AZ أخرى بدون فقدان البيانات.

وتكون مجموعة مستودع البيانات غير متاحة للاستعلامات والتحديثات إلى أن يتم توفير عقدة بديلة وإضافتها إلى قاعدة البيانات. يجعل Amazon Redshift العقدة البديلة متاحةً فورًا ويُحمّل البيانات التي يكثر الوصول إليها من Amazon S3 على RA3 وserverless، ومن النسخة المعكوسة على التخزين المؤقتDS2 وعلى الحوسبة المكثفة Amazon Dense Compute (DC2). لا تدعم مجموعات DC2 وDS2 ذات العقدة الواحدة النسخ المتماثل للبيانات. في حالة فشل محرك أقراص، سوف تحتاج إلى استعادة المجموعة من النسخة الاحتياطية على S3. يمكن إعادة إنشاء مجموعات RA3.XLPLUS ذات العقدة الواحدة بدون أي فقد للبيانات باستخدام البيانات المخزنة في S3 وبمساعدة دعم AWS Support. نوصي باستخدام عقدتين على الأقل لأغراض الإنتاج لزيادة التوافر.

س: ماذا يحدث لتوافر مجموعة مستودع البيانات ومتانة البيانات في حالة تعرض عقدة واحدة للتلف؟

يكتشف Amazon Redshift بشكل تلقائي العقدة التي تعرضت للتلف في مجموعة مستودع البيانات ويستبدلها. وتكون مجموعة مستودع البيانات غير متاحة للاستعلامات والتحديثات إلى أن يتم توفير عقدة بديلة وإضافتها إلى قاعدة البيانات. ويتيح Amazon Redshift العقدة البديلة الخاصة بك بشكل فوري ويقوم بتحميل البيانات التي تصل إليها بشكل أكثر تكرارًا من S3 أولاً للسماح لك باستئناف عمليات الاستعلام عن البيانات في أسرع وقت ممكن. لا تدعم مجموعات العقد المفردة النسخ المتماثل للبيانات. في حالة فشل محرك أقراص، سوف تحتاج إلى استعادة المجموعة من اللقطة الموجودة على S3. نوصي باستخدام عقدتين على الأقل لأغراض الإنتاج.

س: ماذا يحدث لتوافر عُقدة مستودع البيانات الخاصة بي ومتانة البيانات إذا تعرضت منطقة توافر الخدمات (AZ) في مجموعة مستودع البيانات لعطل؟

إذا أصبحت منطقة توافر مجموعة الخدمات لمستودع بيانات Amazon Redshift الخاصة بك غير متوفرة، فسيقوم Amazon Redshift تلقائيًا بنقل مجموعتك إلى منطقة توافر خدمات (AZ) AWS أخرى دون أي فقد للبيانات أو تغييرات في التطبيق. لتنشيط هذا، يجب عليك تمكين إمكانية الانتقال في إعدادات تكوين مجموعتك.

س: هل يدعم Amazon Redshift عمليات التوزيع لمناطق توافر خدمات متعددة؟

حاليًا، لا يدعم Amazon Redshift سوى عمليات التوزيع ذات المنطقة الواحدة. لإعداد تكوين التعافي من الكوارث (DR)، يمكنك تمكين نسخة احتياطية عبر المناطق على مجموعتك. ولذا سينسخ كل النسخ الاحتياطية من مجموعتك إلى منطقة AWS أخرى. في حالة وجود حدث تعافي من الكوارث، يمكن استعادة النسخ الاحتياطية في منطقة النسخ المتماثل لإنشاء مجموعة جديدة. كما يدعم Amazon Redshift مشاركة البيانات عبر المناطق حيث يمكن لمجموعة المستهلك أن تصل إلى البيانات المباشرة في مجموعة منتج من منطقة أخرى. وهذا مدعوم فقط مع Amazon Redshift Serverless وRA3.

الاستعلامات والتحليلات

س: هل Amazon Redshift وRedshift Spectrum متوافقان مع حزمة برامج ذكاء الأعمال وأدوات ETL التي أفضلها؟

نعم، حيث يستخدم Amazon Redshift لغة SQL القياسية في الصناعة ويمكن الوصول إليها باستخدام برامج تشغيل JDBC وODBC القياسية. ويمكنك تنزيل برامج تشغيل JDBC وODBC المُخصَّصة لـ Amazon Redshift من علامة تبويب «Connect Client» في وحدة تحكم Redshift. لقد تحققنا من التكامل مع بائعي BI وETL‏ الذين يملكون شهرة عريضة، ومجموعة منهم يعرضون التجارب المجانية لمساعدتك على بدء تحميل بياناتك وتحليلها. يمكنك أيضًا التوجه إلى AWS Marketplace من أجل نشر وتكوين الحلول المصممة للعمل مع Amazon Redshift خلال دقائق.

يدعم Amazon Redshift Spectrum كل أدوات عملاء Amazon Redshift. يمكن أن تساهم أدوات العملاء في الاتصال بنقطة نهاية مجموعة Amazon Redshift باستخدام اتصالات ODBC أو JDBC. ولا يلزم إجراء أي تغييرات.

ويمكنك استخدام نفس البناء اللغوي للاستعلام بالضبط وامتلاك نفس القدرات اللازمة للوصول إلى الجداول في Redshift Spectrum مثل تلك التي تمتلكها للجداول في وحدات التخزين المحلية في مجموعة Redshift لديك. وتتم الإشارة إلى الجداول الخارجية باستخدام اسم المخطط المعرّف في الأمر CREATE EXTERNAL SCHEMA حيث تم تسجيلها.

س: ما تنسيقات البيانات وتنسيقات الضغط التي يدعمها Amazon Redshift Spectrum؟

يدعم Amazon Redshift Spectrum حاليًا العديد من تنسيقات البيانات مفتوحة المصدر، منها Avro، وCSV، وGrok، وAmazon Ion، وJSON، وORC، وParquet، وRCFile، وRegexSerDe، وSequence، وText، وTSV.

يدعم Amazon Redshift Spectrum حاليًا ضغط Gzip وSnappy.

س: ماذا يحدث إذا كان هناك جدول في وحدات التخزين المحلية لدي له نفس اسم الجدول الخارجي؟

تمامًا كما هو الحال مع الجداول المحلية، يمكنك استخدام اسم المخطط من أجل اختيار ما تعنيه بالضبط من خلال استخدام schema_name.table_name في الاستعلام الخاص بك.

س: أستخدم Hive Metastore من أجل تخزين بيانات التعريف بشأن مستودع بيانات S3 الخاص بي. فهل يمكنني استخدام Redshift Spectrum؟

نعم. أمر CREATE EXTERNAL SCHEMA يدعم Hive Metastores. نحن لا ندعم DDL حاليًا في مقابل Hive Metastore.

س: كيف يمكن أن أحصل على قائمة بكل جداول قاعدة البيانات الخارجية التي يتم إنشاؤها في المجموعة الخاصة بي؟

للحصول على تلك المعلومات، يمكنك عمل الاستعلام على جدول النظام SVV_EXTERNAL_TABLES.

س: هل تدعم Redshift القدرة على استخدام التعلم الآلي مع SQL؟

نعم، تُسهل ميزة Amazon Redshift ML (معاينة) على مستخدمي SQL إنشاء نماذج التعلم الآلي (ML) وتدريبها ونشرها باستخدام أوامر SQL المعتادة. يتيح لك التعلم الآلي Amazon Redshift الاستفادة من بياناتك في Amazon Redshift باستخدام Amazon SageMaker، وهي خدمة تعلُّم آلي مُدارة بالكامل. تدعم Amazon Redshift التعلم بدون إشراف (K-Means) والتعلم بإشراف (Autopilot، XGBoost، MLP algorithms). كما يمكنك استخدام AWS Language AI لترجمة وتحرير وتحليل حقول النصوص في استعلامات SQL مع وظائف Lambda UDF مسبقة الإعداد - طالع منشور المدونة.

س: هل توفر Amazon Redshift واجهة برمجة تطبيقات (API) للاستعلام عن البيانات؟

تقوم Amazon Redshift بتوفير Data API التي تُمكّنك من الوصول إلى البيانات بدون مجهود من Amazon Redshift مع جميع أنواع التطبيقات المستندة إلى خدمات الويب التقليدية، والأصلية للسحابة، والمستندة إلى حاويات، والتي بلا خوادم وكذلك التطبيقات القائمة على الأحداث. تعمل Data API على تبسيط الوصول إلى Amazon Redshift نظرًا لعدم احتياجك إلى تكوين برامج التشغيل وإدارة اتصالات قاعدة البيانات. أو يمكنك تشغيل أوامر SQL إلى مجموعة Amazon Redshift عن طريق استدعاء نقطة نهاية API مؤمَّنة توفرها Data API. تتولى Data API إدارة اتصالات قاعدة البيانات وتخزين البيانات مؤقتًا. تُعد Data API غير متزامنة، لذا يمكنك استرجاع نتائجك لاحقًا. تُخزّن نتائج الاستعلام لمدة 24 ساعة.

س: ما أنواع بيانات الاعتماد التي يمكنني استخدامها مع Amazon Redshift Data API؟

تدعم Data API كلاً من بيانات اعتماد IAM واستخدام مفتاح سري من AWS Secrets Manager. تعمل Data API على توحيد بيانات اعتماد AWS Identity and Access Management (IAM) بحيث يُمكنك استخدام موفِّري الهوية مثل Okta أو Azure Active Directory أو بيانات اعتماد قاعدة البيانات المُخزَّنة في Secrets Manager دون تمرير بيانات اعتماد قاعدة البيانات في مكالمات API.

س: هل يمكنني استخدام Amazon Redshift Data API من AWS CLI؟

نعم، يُمكنك استخدام Data API من AWS CLI باستخدام خيار سطر أوامر aws redshift-data.

س: هل Redshift Data API متكاملة مع خدمات AWS الأخرى؟

يُمكنك استخدام Data API من خدمات أخرى مثل AWS Lambda وAWS Cloud9 وAWS AppSync وAmazon EventBridge.

س: هل يتعين عليَّ أن أدفع بشكل منفصل مقابل استخدام Amazon Redshift Data API؟

لا، لا توجد رسوم منفصلة لاستخدام Data API.

النسخ الاحتياطي والاستعادة

س: كيف تقوم Amazon Redshift بعمل النسخ الاحتياطي للبيانات الخاصة بي؟ كيف يمكنني استعادة مجموعتي من النسخة الاحتياطية؟

تقوم مجموعات Amazon Redshift RA3 وAmazon Redshift Serverless باستخدام edshift Managed Storage والذي لديه دائمًا أحدث نسخ البيانات المتاحة. تعكس مجموعات DS2 وDC2 البيانات على المجموعة لضمان توفر آخر نسخة في حالة الفشل. يتم إنشاء النسخ الاحتياطية على جميع أنواع مجموعات Redshift ويتم الاحتفاظ بها لمدة 24 ساعة وتتوفر على نقاط الاستعادة بلا خوادم على مدار الـ 24 ساعة الماضية.

كما يمكنك إنشاء نسخك الاحتياطية التي يمكن الاحتفاظ بها للأبد. ويمكن إنشاء هذه النسخ الاحتياطية في أي وقت ويمكن تحويل نسخ Amazon Redshift الاحتياطية الآلية أو نقاط استعادة Amazon Redshift Serverless إلى نسخة احتياطية للمستخدم للاحتفاظ بها لمدة أطول.

يمكن لـ Amazon Redshift أيضًا نسخ النسخ الاحتياطية أو نقاط الاستعادة بطريقة غير متزامنة إلى Amazon S3 في منطقة أخرى للتعافي من الكوارث.

في مجموعة DS2 أو DC2، يقتصر تخزين النسخ الاحتياطي المجاني على إجمالي حجم التخزين على العُقد في مجموعة مستودع البيانات، ويسري فقط على مجموعات مستودع البيانات النشطة.

على سبيل المثال، إذا كان إجمالي سعة تخزين مستودع البيانات يبلغ 8 تيرابايت، فسوف نحاول توفير مساحة تخزين للنسخ الاحتياطي مقدارها 8 تيرابايت بدون أي تكلفة إضافية. إذا كنت ترغب في زيادة مدة الاحتفاظ بالنسخ الاحتياطي بما يتجاوز يوم واحد، فيمكنك فعل ذلك باستخدام وحدة إدارة تحكم AWS أو واجهات برمجة تطبيقات Amazon Redshift. للحصول على المزيد من المعلومات بشأن النسخ الاحتياطية التلقائية، يُرجى الرجوع إلى دليل إدارة Amazon Redshift.

يقوم Amazon Redshift بعمل النسخ الاحتياطي للبيانات التي تغيرت، وبالتالي فإن أغلب النسخ الاحتياطية لا تستخدم إلا مساحة ضئيلة للغاية من مساحة تخزين النسخ الاحتياطي الخالية لديك. عندما ترغب في استعادة نسخة احتياطية، يتاح لك الوصول إلى كل النسخ الاحتياطية الآلية في نافذة الاحتفاظ بالنسخ الاحتياطية لديك. وبمجرد أن تختار نسخة احتياطية يتم الاستعادة منها، سوف نقوم بتوفير مجموعة مستودع بيانات جديدة واستعادة البيانات الخاصة بك إليها.

س: كيف يمكنني إدارة الاحتفاظ بالنسخ الاحتياطية التلقائية واللقطات الخاصة بي؟

يمكنك استخدام وحدة الإدارة في AWS أو واجهة برمجة تطبيقات ModifyCluster من أجل إدارة الفترة الزمنية التي يتم خلالها الاحتفاظ بالنسخ الاحتياطية التلقائية من خلال تعديل معامل RetentionPeriod. إذا كنت ترغب في إيقاف تشغيل النسخ الاحتياطي التلقائي تمامًا، يمكنك إعداد فترة الاحتفاظ على الصفر (هذا الإعداد غير موصى به).

س: ماذا يحدث للنسخ الاحتياطية الخاصة بي إذا قمت بحذف مجموعة مستودع البيانات الخاصة بي؟

عندما تقوم بحذف مجموعة مستودع بيانات، يمكنك تحديد ما إذا كان يتم إنشاء لقطة نهائية أم لا عند الحذف. ويتيح ذلك إمكانية استعادة مجموعة مستودع البيانات التي يتم حذفها في وقت لاحق. يتم الاحتفاظ بكل النسخ الاحتياطية اليدوية التي سبق إنشاؤها لمجموعة مستودع البيانات ويتم إصدار الفواتير بشأنها حسب أسعار Amazon S3 القياسية، إلا إذا اخترت حذفها.

المراقبة والصيانة

س: كيف يمكنني مراقبة أداء مجموعة مستودع بيانات Amazon Redshift؟

تتاح قياسات استخدام الحوسبة واستخدام التخزين وحركة القراءة والكتابة إلى مجموعة مستودع بيانات Amazon Redshift مجانًا عبر وحدة الإدارة في AWS أو واجهات برمجة تطبيقات Amazon CloudWatch. يمكنك كذلك إضافة قياسات إضافية مُعرَّفة من قِبل المستخدم عبر وظيفة القياسات المُخصَّصة لـ Amazon CloudWatch. توفِّر وحدة الإدارة في AWS لوحة معلومات مراقبة تساعدك على مراقبة سلامة وأداء كل المجموعات لديك. كما يوفر Amazon Redshift معلومات حول أداء الاستعلام والمجموعة عبر وحدة الإدارة في AWS. وتتيح لك هذه المعلومات القدرة على رؤية أي من المستخدمين والمجموعات التي تستهلك أكبر قدر من موارد النظام لتشخيص مشكلات الأداء من خلال الاطلاع على خطط الاستعلام وإحصاءات التنفيذ. بالإضافة إلى ذلك، يمكن رؤية استخدام الموارد في كل عقدة حوسبة لديك للتحقق من أن لديك البيانات والاستعلامات المتوازنة بشكل جيد عبر كل العقد.

س: ما المقصود بنافذة الصيانة؟ هل ستبقى مجموعة مستودع البيانات الخاصة بي متاحةً أثناء صيانة البرامج؟

يقوم Amazon Redshift بشكل دوري بتنفيذ الصيانة من أجل تطبيق الإصلاحات والتحسينات والميزات الجديدة على المجموعة الخاصة بك. ويمكنك تغيير نوافذ الصيانة المجدولة من خلال تعديل المجموعة، سواء برمجيًا أو باستخدام وحدة تحكم Redshift. وخلال نوافذ الصيانة هذه، لا تكون مجموعة Amazon Redshift متاحةً للتشغيل العادي. للحصول على المزيد من المعلومات بشأن نوافذ الصيانة والجداول حسب المنطقة، اطلع على نوافذ الصيانة في دليل إدارة Amazon Redshift.

معرفة المزيد عن تسعير Amazon Redshift

زر صفحة التسعير
هل أنت جاهز للبناء؟
بدء استخدام Amazon Redshift
هل لديك مزيد من الأسئلة؟
اتصل بنا