بدء المشروع

7 خطوات | 60 دقيقة

س: ما المقصود بتخزين البيانات؟

التحليلات في كل مكان. نستخدم جميعًا التقارير ولوحات المعلومات لإدارة أعمالنا، وللإبلاغ عن تقدمنا ​​إلى أصحاب المصلحة، وإجراء تحليلات مخصصة لدعم اتخاذ القرار. وفي حقيقة الأمر، يتم تشغيل هذه التقارير ولوحات المعلومات وأدوات BI بواسطة مستودعات البيانات، التي تقوم بتخزين البيانات بكفاءة لتقليل معدل الإدخال/الإخراج إلى أدنى حد وتقديم نتائج الاستعلام بسرعة فائقة إلى مئات وآلاف المستخدمين في وقت واحد. على عكس قواعد بيانات المعاملات، تستخدم مستودعات البيانات تصميمات متخصصة وتخزين للاستعلام السريع وأداء تحميل البيانات. تحتاج مستودعات البيانات أيضًا إلى أن تكون قابلة للتكيف بدرجة كبيرة بحيث يمكنك إضافة المزيد من مصادر البيانات طوال الوقت لإثراء التحليلات والرؤى. وأخيرًا، يجب أن تتكامل مستودعات البيانات بسلاسة مع أدوات ذكاء الأعمال التابعة لجهات خارجية وعملاء SQL، وتدعم لغة SQL القياسية بحيث يمكن للعملاء استخدام مهاراتهم بالفعل.

س: لماذا يجب علي تشغيل تخزين البيانات على AWS؟

يعتبر Amazon Redshift، حل تخزين البيانات لدينا، سريعًا وسهل الاستخدام ومُدارًا بالكامل. يقوم بأتمتة توفير البنية التحتية والمهام الإدارية مثل النسخ الاحتياطية والنسخ المتماثل والتصحيح. يتكامل بسلاسة مع أدوات BI وETL التابعة لجهات خارجية، بحيث يمكنك الحصول على تقريرك الأول في غضون بضع دقائق. ولا يوجد حد لكمية البيانات التي يمكنك تحميلها وتحليلها. مع نمو بياناتك، لا داعي للقلق بشأن ترقيات النظام المكلفة أو بطء الأداء. Amazon Redshift سريع على أي نطاق لأنه يستخدم التخزين العمودي والعديد من تقنيات التحسين. كما إن Amazon Redshift فعال من حيث التكلفة؛ فإنك لا تدفع إلا مقابل ما تستخدمه. خلاصة القول، يمكنك الحصول على عدد غير محدود من المستخدمين الذين يقومون بتحليلات غير محدودة على جميع بياناتك مقابل 1000 USD فقط لكل تيرابايت في السنة. 

س: ما المقصود بـ Amazon Redshift؟

يعد Amazon Redshift مستودع بيانات سريعًا ومدارًا بالكامل يُسهل عملية تحليل كل بياناتك ويجعلها موفرة للتكلفة باستخدام أدوات ذكاء الأعمال الحالية لديك. يمكنك البدء بحجم صغير مقابل 0.25 USD للساعة بدون أي التزامات، والتوسع إلى البيتابايتات من البيانات مقابل 1000 USD لكل تيرابايت سنويًا، ما يساوي أقل من عُشر تكلفة الحلول التقليدية. يشهد العملاء ضغط حجم بياناتهم إلى 3 أضعاف، مما يقلل تكلفتها إلى 333 USD لكل تيرابايت غير مضغوطة سنويًا.

س: كيف تتم مقارنة أداء Amazon Redshift بمعظم قواعد البيانات التقليدية لتخزين البيانات وتحليلها؟

تستخدم Amazon Redshift مجموعة متنوعة من الابتكارات لتحقيق أداء أعلى بنسبة تصل إلى عشرة أضعاف قواعد البيانات التقليدية لتخزين البيانات وأعباء العمل التحليلية:

  • الموازاة واسعة النطاق: يوفر Amazon Redshift الأداء المتميز للاستعلامات مع قواعد البيانات التي تتراوح في حجمها بين الجيجابايت والإكسابايت. ويستخدم Redshift التخزين العمودي وضغط البيانات وخرائط المنطقة لتقليل كمية الإدخال/الإخراج اللازمة لتنفيذ الاستعلامات. ويستخدم بنية مستودع بيانات للمعالجة الموازية على نطاق واسع لموازاة عمليات SQL وتوزيعها للاستفادة من جميع الموارد المتاحة. يتم تصميم الأجهزة الأساسية لمعالجة البيانات عالية الأداء، وذلك باستخدام التخزين المرفق الداخلي لتحقيق أقصى قدر من الإنتاجية بين وحدات المعالجة المركزية والمحركات وشبكة متداخلة بنطاق ترددي عالٍ لتعظيم الإنتاجية بين العقد.
  • تعلم الآلة: يستخدم Amazon Redshift تعلم الآلة لتقديم إنتاجية عالية، بغض النظر عن أعباء العمل أو الاستخدام المتزامن. يستخدم Redshift لوغاريتمات معقدة للتنبؤ بأوقات تشغيل الاستعلام الواردة، وتعيينها لقائمة الانتظار المثلى للمعالجة الأسرع. فعلى سبيل المثال، يتم توجيه الاستعلامات، مثل لوحات المعلومات والتقارير ذات متطلبات التزامن العالية، إلى قائمة انتظار سريعة للمعالجة الفورية. ومع زيادة التزامن، تتنبأ Amazon Redshift بوقت بدء قائمة الانتظار، وتنشر الموارد العابرة تلقائيًا باستخدام ميزة ضبط النطاق المتزامن لضمان الأداء السريع باستمرار، بغض النظر عن التباين في الطلب على المجموعة.
  • التخزين المؤقت للنتائج: تستخدم Amazon Redshift التخزين المؤقت للنتائج من أجل توفير أوقات استجابة سريعة للغاية للاستعلامات المكررة. تشهد لوحات المعلومات والتصورات وأدوات ذكاء الأعمال التي تقوم بتنفيذ الاستعلامات المتكررة تحسنًا ضخمًا في الأداء. عندما يتم تنفيذ استعلام، يبحث Redshift في الذاكرة المؤقتة عن وجود نتائج مؤقتة مخزنة من استعلام سابق. في حالة وجود نتيجة مخزنة في الذاكرة المؤقتة ولم تتغير البيانات، تتم إعادة النتيجة المخزنة بشكل فوري بدلاً من إعادة تشغيل الاستعلام. 

س: كيف يمكنني الوصول إلى مجموعة مستودع البيانات الجاري تشغيلها؟

بمجرد إتاحة مجموعة مستودع بياناتك، يمكنك استرداد نقطة النهاية وسلسلة اتصال JDBC وODBC من وحدة الإدارة في AWS أو باستخدام واجهات برمجة تطبيقات Redshift. يمكنك بعد ذلك استخدام سلسلة الاتصال هذه مع أداة قاعدة البيانات المفضلة لديك أو لغة البرمجة أو أداة ذكاء الأعمال (BI). ستحتاج إلى تفويض طلبات الشبكة إلى مجموعة مستودع البيانات في الحالة قيد التشغيل. للحصول على شرح تفصيلي، يرجى الرجوع إلى دليل بدء الاستخدام.

س: هل Amazon Redshift متوافقة مع حزمة برامج ذكاء الأعمال وأدوات ETL التي أفضلها؟

يستخدم Amazon Redshift لغة SQL القياسية في الصناعة ويمكن الوصول إليها باستخدام برامج تشغيل JDBC وODBC القياسية. ويمكنك تنزيل برامج تشغيل JDBC وODBC المخصصة لـ Amazon Redshift من علامة تبويب «العميل المتصل» في وحدة التحكم. لقد تحققنا من التكامل مع بائعي BI وETL‏ الذين يملكون شهرة عريضة، ومجموعة منهم يعرضون التجارب المجانية لمساعدتك على بدء تحميل وتحليل البيانات الخاصة بك. كما يمكنك كذلك التوجه إلى AWS Marketplace لنشر الحلول المصممة للعمل وتهيئتها باستخدام Amazon Redshift خلال دقائق.

س: كيف يمكنني البدء في استخدام Amazon Redshift؟

يمكنك تجربة Amazon Redshift مجانًا. إذا لم تنشئ مجموعة Amazon Redshift من قبل، فأنت مؤهل للحصول على نسخة تجريبية مجانية لمدة شهرين من العقدة DC1.Large. تحصل على 750 ساعة شهريًا مجانًا، ساعات كافية لتشغيل عقدة DC1.Large باستمرار مع 160 جيجابايت من مساحة التخزين المضغوطة SSD. يمكنك أيضًا إنشاء مجموعات بعقد متعددة لاختبار مجموعات بيانات أكبر، والتي ستستهلك ساعاتك المجانية بشكل أسرع. بمجرد انتهاء صلاحية التجربة المجانية لمدة شهرين أو تجاوز استخدامك 750 ساعة شهريًا، يمكنك إغلاق مجموعتك، وتجنب أي رسوم، أو إبقائها قيد التشغيل وفقًا لمعيار السعر حسب الطلب.

بدء المشروع