مخازن البيانات والتحليلات على AWS

أسرع طريقة للحصول على إجابات من جميع بياناتك إلى جميع المستخدمين

تقدّم AWS مجموعة متكاملة من الخدمات التي توفر كل ما تحتاج إليه لتقوم ببناء وإدارة مخزن بيانات للتحليلات بسرعة وسهولة. تستطيع مخازن البيانات المُدارة من قبل AWS المقياس وخفة الحركة والمرونة اللازمة لجمع أنواع مختلفة من طرق البيانات والتحليلات لاكتساب رؤى أعمق، بطرق لا تستطيع مخازن البيانات التقليدية ومستودعات البيانات القيام بها. توفر AWS للعملاء المصفوفة الأوسع من التحليلات وخدمات تعلم الآلة لسهولة الوصول إلى جميع البيانات ذات الصلة، دون المساومة على الأمان أو الحوكمة.

هناك منظمات ذات مخازن بيانات وتحليلات على AWS أكثر من أي مكان آخر. يثق العملاء مثل NASDAQ وZillow وYelp وiRobot وFINRA في AWS لتشغيل أعباء العمل التحليلية المهمة لأعمالهم.

مخازن البيانات والتحليلات على AWS

مخازن البيانات والتحليلات على AWS

لبناء مخازن البيانات وحلول التحليلات الخاصة بك، توفر AWS مجموعة الخدمات الأكثر شمولاً لنقل وتخزين وتحليل بياناتك.

aws-datalake-diagram-simplified

نقل البيانات

قم باستيراد بياناتك في مكان العمل وفي الوقت الفعلي.

مخزن البيانات

قم بتخزين أي نوع من البيانات بصورة آمنة، من جيجابايت إلى إكسابايت.

التحليلات

قم بتحليل بياناتك مع التشكيلة الأوسع من خدمات التحليلات.

Machine Learning

قم بالتنبؤ بالنتائج المستقبلية، وحدد إجراءات للاستجابة السريعة.

لماذا مخازن البيانات والتحليلات على AWS؟

أسهل طريقة لبناء مخازن البيانات

بناء مخزن بيانات آمن في أيام بدلاً من شهور. لقد سمحت لنا تجربتنا في العمل مع عشرات الآلاف من العملاء لبناء مخازن بيانات منتجة بأن نجعل كل جانب من جوانب تحليل البيانات في السحابة بشكل أسهل. على سبيل المثال، تتولى AWS Lake Formation أتمتة الخطوات اليدوية المطلوبة لبناء مخزن بيانات وتوفر آلية أمان واحدة عبر جميع البيانات، لذلك تقضي وقتًا أقل في العبء الثقيل غير المتمايز المطلوب لبناء مخزن البيانات ومزيدًا من الوقت لاستكشاف بياناتك للحصول على إجابات لأسئلتك الأكثر أهمية.

أفضل أداء بأقل تكلفة

AWS هو المكان الأسرع والأكثر فعالية من حيث التكلفة لتخزين البيانات وتحليلها. على سبيل المثال، توفر Amazon S3 خمس فئات للتخزين وإدارة دورة الحياة للبيانات التلقائية، بحيث تدفع فقط ما هو مطلوب لبياناتك بناءً على طريقة استخدام هذه البيانات. إن Amazon Redshift أسرع ثلاثة أضعاف من أي مستودع آخر للبيانات السحابية ويزداد سرعة كل عام. توفر Amazon EMR أسرع مكان لتشغيل أعباء العمل الخاصة بـ Apache Spark وApache HIVE في السحاب. يُسهل التكامل العميق لـ EMR مع باقي AWS من الاستفادة من ميزات توفير التكاليف، مثل مثيلات EC2 Spot، لتقليل التكاليف بنسبة تصل إلى 90%.

أكثر شمولاً وانفتاحًا

لا فائدة من الاحتفاظ بجميع بياناتك في خدمة تحليلات صامتة واحدة بعد الآن. تتطلب التحليلات الحديثة مجموعة من الأدوات والأساليب المختلفة، بما في ذلك SQL وR وScala وJupyter وPython، للحصول على الأفكار والإجابات الصحيحة باستخدام مجموعة متنوعة من اللغات. توفر AWS مجموعة شاملة ومدروسة من الخدمات التحليلية التي تعمل مقابل مخزن البيانات المفتوح حتى تتمكن من استخدام الأداة الصحيحة للمهمة الصحيحة دون الحاجة لنقل البيانات أو تحويلها لتناسب كل أساليب التحليل المختلفة. تدعم جميع خدماتنا الوصول إلى البيانات المخزنة في مخزن الكائنات الواحد (S3) مع واجهات برمج التطبيقات (API) المفتوحة بتنسيقات مفتوحة (مثل: Apache Paquet، Apache ORC، Apache Avro) واستخدام كل من خاصية (Redshift لتخزين البيانات) والمحركات المفتوحة (مثل: Spark ،Hive). 

الأكثر أمنًا

إن الحفاظ على أمان بياناتك والامتثال باللوائح ذات الصلة أمر مهم. توفر AWS مجموعة شاملة من الأدوات متجاوزة وظيفة الأمان القياسية مثل التشفير والتحكم في الوصول إلى المراقبة الاستباقية والإدارة الموحدة لسياسات الأمان. على سبيل المثال، تساعد Amazon Macie على مراقبة مخزن البيانات لضمان أنك لا تتعرض عن طريق الخطأ لبيانات الاعتماد أو معلومات تحدد الهوية الشخصية (PII). تساعد Amazon Inspector على تطبيق أفضل الممارسات وتحدد مشكلات التكوين التي قد يتم استغلالها وتسمح لك AWS Lake Formation بالتحكم المستمر في الوصول إلى البيانات في مخزن البيانات عبر جميع الخدمات التحليلية. 

نقل البيانات

الخطوة الأولى لبناء مخازن البيانات على AWS هي أن تقوم بنقل البيانات للسحابة. تقيد الحدود المادية للشبكة وسرعات النقل القدرة على نقل البيانات دون تعطيل كبير وتكلفة عالية والكثير من الوقت. لتسهيل نقل البيانات وجعلها أكثر مرونة، توفر AWS النطاق الأوسع من الخيارات لنقل البيانات إلى السحابة.

لبناء مهمات ETL وتحويلات ML لمخزن البيانات الخاصة بك، تعرّف على AWS Lake Formation.

نقل البيانات في مقر العمل

توفر AWS العديد من الطرق لنقل البيانات من مركز البيانات الخاص بك إلى AWS. لإنشاء وصلة شبكة مخصصة بين شبكتك وAWS، يمكنك استخدام AWS Direct Connect. لنقل البيتابايت إلى إكسابايت من البيانات إلى AWS باستخدام أجهزة مادية، يمكنك استخدام AWS Snowball و AWS Snowmobile. لتجعل التطبيقات الخاصة بك في مقر العمل تقوم بتخزين البيانات بشكل مباشر في AWS، يمكنك استخدام AWS Storage Gateway.  

نقل البيانات في الوقت الفعلي

توفر AWS العديد من الطرق لاستيعاب بيانات الوقت الفعلي التي يتم إنشائها من مصادر جديدة مثل المواقع وتطبيقات الجوال والأجهزة المتصلة بالإنترنت. لجعل التقاط وتحميل بيانات التدفق أو بيانات جهاز إنترنت الأشياء أمرًا بسيطًا، يمكنك استخدام Amazon Kinesis Data Firehose وAmazon Kinesis Video Streams وAWS IoT Core.  

مخزن البيانات

بمجرد أن تصبح البيانات جاهزة للسحابة، تجعل AWS تخزين البيانات في أي تنسيق أمرًا سهلاً بأمان وعلى نطاق ضخم مع Amazon S3 وAmazon Glacier. لتسهيل اكتشاف البيانات ذات الصلة على المستخدمين النهائيين للاستخدام في التحليلات الخاصة بهم، تنشئ AWS Glue تلقائيًا كتالوجًا واحدًا قابلاً للبحث والاستعلام من قبل المستخدمين.

لبناء مخزن آمن للبيانات بشكل أسرع، تعرّف على المزيد حول AWS Lake Formation.

تخزين الكائن

Amazon S3

Amazon S3 آمن ولديه قابلية عالية للتكيف وتخزين شديد التحمل للكائنات مع زمن استجابة بالميلي ثانية لإمكانية الوصول إلى البيانات. تم تصميم S3 لتخزين أي نوع من البيانات من أي مكان – مواقع الويب وتطبيقات الجوال وتطبيقات الشركات والبيانات من أجهزة استشعار أو أجهزة IoT. تم تصميمها لتخزين واسترجاع أي كمية من البيانات، مع توافر لا مثيل له، وتم بناءه من الأساس لتقديم 99.999999999% (11 تسعة) من قوة التحمل. يركز S3 Select قراءة واسترجاع البيانات، مما يخفض أوقات الاستجابة إلى ما يصل إلى 400%. يوفر S3 أمانًا شاملاً وقدرات امتثال تلبي المتطلبات التنظيمية الأكثر صرامة.  

النسخ الاحتياطي والأرشيف

Amazon Glacier

Amazon Glacier آمن وشديد التحمل ولديه تخزين ذو تكلفة قليلة للغاية للنسخ الاحتياطي والأرشيف طويل المدى الذي يتمكن من الوصول إلى البيانات في دقائق، وبالمثل يقرأ Glacier Select ويسترجع البيانات المطلوبة فقط. وهي مصممة لتوفير حماية للبيانات بنسبة تبلغ 99.999999999% (11 تسعة)، وتوفر إمكانات شاملة للأمان والامتثال يمكن أن تساعد حتى في تلبية المتطلبات التنظيمية الأكثر صرامة. يمكن للعملاء تخزين البيانات مقابل 0.004 USD لكل جيجابايت شهريًا، وهو ما يمثل مزايا توفير كبيرة مقارنةً بالحلول المحلية.

كتالوج البيانات

AWS Glue

تعتبر AWS Glue خدمة مُدارة بالكامل توفر كتالوجًا للبيانات لجعل البيانات الموجودة في مخزن البيانات قابلة للاكتشاف، ولديها القدرة على القيام بالاستخراج والتحويل والتحميل (ETL) لتحضير البيانات للتحليل. يتم إنشاء كتالوج البيانات تلقائيًا كمخزن بيانات تعريف مستمر لجميع أصول البيانات، مما يجعل جميع البيانات قابلة للبحث والاستعلام في عرض واحد.

التحليلات

توفر AWS مجموعة الخدمات التحليلية الأوسع والأكثر فعالية من حيث التكلفة التي تعمل على مخزن البيانات. تم تصميم كل خدمة تحليلية لغرض محدد لنطاق واسع من حالات استخدام التحليلات مثل التحليل التفاعلي ومعالجة البيانات الكبيرة باستخدام Apache Spark وHadoop وتخزين البيانات والتحليلات في الوقت الفعلي والتحليلات التشغيلية ولوحات المعلومات والتصورات.

لإدارة إمكانية وصول آمنة وذاتية الخدمة للبيانات الموجودة في مخزن البيانات الخاص بخدمات التحليلات، تعرّف على المزيد حول AWS Lake Formation.

التحليلات التفاعلية

Amazon Athena

للتحليل التفاعلي، تقوم Amazon Athena بتسهيل تحليل البيانات بشكل مباشر في S3 وGlacier باستخدام استعلامات SQL قياسية. ولا تستند خدمة Athena إلى خادم، لذا لا توجد بنية تحتية للإعداد أو الإدارة. يمكنك البدء في الاستعلام عن البيانات فورًا، والحصول على النتائج في ثواني وادفع فقط مقابل الاستعلامات التي تقوم بتشغيلها. ليس عليك سوى الإشارة إلى بياناتك في Amazon S3 وتعريف المخطط والبدء في الاستعلام باستخدام لغة SQL القياسية. يتم تقديم معظم النتائج خلال ثوانٍ.  

معالجة البيانات الكبيرة

Amazon EMR

لمعالجة البيانات الكبيرة باستخدام أطر عمل Spark وHadoop، توفر Amazon EMR خدمة مُدارة تجعل معالجة كميات هائلة من البيانات أمرًا سهلاً وسريعًا وفعال من حيث التكلفة. تدعم Amazon EMR 19 مشروع مختلف مفتوح المصدر بما في ذلك Hadoop وSpark وHBase وPresto مع دفاتر EMR لهندسة البيانات وتطوير علم البيانات والتعاون. يتم تحديث كل مشروع في EMR خلال 30 يومًا من إصدار النسخة، يضمن لك الحصول على الأحدث والأعظم من المجتمع بلا جهد.

تخزين البيانات

Amazon Redshift

لتخزين البيانات، يوفر Amazon Redshift القدرة على تشغيل الاستعلامات التحليلية المعقدة ضد مجموعة من البيتابايت من البيانات المنظمة ويشمل Redshift Spectrum الذي يقوم بتشغيل استعلامات SQL بشكل مباشر ضد مجموعة من الإكسابايت من البيانات المنظمة وغير المنظمة في S3 دون الحاجة إلى نقل غير ضروري للبيانات. تعتبر تكلفة Amazon Redshift أقل من عشر تكلفة الحلول التقليدية. ابدأ صغيرًا مقابل 0.25 USD فقط في الساعة، وقم بزيادة التكيف لمجموعة بيتابايت من البيانات مقابل 1,000 USD لكل تيرابايت في السنة.

تحليل في الوقت الفعلي

Amazon Kinesis

لتحليلات الوقت الفعلي، يجعل Amazon Kinesis تجميع ومعالجة وتحليل البيانات المتدفقة مثل بيانات القياس الخاصة بإنترنت الأشياء وسجلات التطبيقات ونقرات مواقع الويب. يمكّنك هذا من معالجة البيانات وتحليلها عند وصولها في مخزن البيانات الخاص بك والاستجابة لها في الوقت الفعلي بدلاً من الانتظار حتى يتم جمع جميع بياناتك قبل بدء المعالجة.

التحليلات التشغيلية

Amazon Elasticsearch Service

للتحليلات التشغيلية مثل مراقبة التطبيق وتحليلات السجلات وتحليلات النقرات، تسمح لك Amazon Elasticsearch Service بالبحث في بياناتك واستكشافها وتصفيتها وتجميعها وتصورها في وقت قريب من الزمن الفعلي. تقدم Amazon Elasticsearch Service مُدارة واجهات برمجة تطبيقات Elasticsearch سهلة الاستخدام وإمكانيات تحليل في الزمن الفعلي إلى جانب الإتاحة والقابلية للتكيف والأمان الذين تتطلبهم أعباء العمل في الإنتاج.

 

لوحات المعلومات والتصورات

Amazon QuickSight

للوحات المعلومات والتصورات، يوفر لك Amazon QuickSight خدمة تحليلات للنشاط التجاري سريعة ومُدارة من قبل السحابة تجعل بناء تصورات مذهلة ولوحات معلومات ثرية يمكن الوصول إليها من أي متصفح أو جهاز محمول أمرًا سهلاً.

 

Machine Learning

لحالات استخدام التحليلات التنبؤية، توفر AWS مجموعة كبيرة من خدمات تعلم الآلة والأدوات التي تعمل على مخزن البيانات الخاص بك على AWS. تأتي خدماتنا من المعرفة والقدرة التي قمنا ببنائها في Amazon، حيث قام تعلم الآلة بدعم محركات التوصيات الخاصة بموقع Amazon.com وسلسلة التوريد والتنبؤ ومراكز الشحن وتخطيط السعة.  

أُطر العمل والواجهات

لمتدربين خبراء في تعلم الآلة وعلماء بيانات، توفر AWS AWS Deep Learning AMIs  التي تجعل بناء نماذج التعلم العميق وبناء مجموعات مع مثيلات وحدة معالجة الرسومات المحسنة من قبل تعلم الآلة والتعلم العميق أمرًا سهلاً. تدعم AWS كل أطر عمل التعلم الآلي الرئيسية، بما في ذلك Apache MXNet وTensorFlow وCaffe2، ما يمكنك من إحضار أو تطوير أي نموذج تختاره. توفر هذه القدرات طاقة وسرعة وكفاءة لا مثيل لها والتي يتطلبها التعلم العميق وتعلم الآلة.

خدمات النظام الأساسي

للمطورين الذين يرغبون في التعمق مع تعلم الآلة، تعتبر Amazon SageMaker خدمة نظام أساسي تجعل العملية بأكملها من بناء وتدريب ونشر نماذج تعلم الآلة أمرًا سهلاً عن طريق توفير كل شيء تحتاجه للاتصال ببيانات التدريب الخاصة بك وتحديد وتحسين اللوغاريتم وإطار العمل الأفضل ونشر نموذجك على مجموعات التكيف التلقائي الخاصة بـ Amazon EC2. تحتوي SageMaker أيضًا على دفاتر Jupyter المستضافة التي تجعل من السهل استكشاف بيانات التدريب المخزنة الخاصة بك ومشاهدتها في Amazon S3.

خدمات التطبيق

للمطورين الذين يرغبون في إدخال وظائف الذكاء الاصطناعي المعدة سابقًا في تطبيقاتهم، توفر AWS واجهات برمجة التطبيقات الموجهة لإيجاد الحلول لرؤية جهاز الكمبيوتر ومعالجة طبيعية للغة. تتيح هذه التطبيقات للمطورين إمكانية إضافة الذكاء لتطبيقاتهم دون تطوير نماذجهم الخاصة وتدريبها.

مخازن البيانات والتحليلات المبنية على AWS أكثر من أي مكان آخر

ابدأ باستخدام AWS

Step 1 - Sign up for an AWS account

اشترك للحصول على حساب AWS

الوصول على الفور إلى الطبقة المجانية لخدمة AWS.
 
icon2

بناء مخزن بيانات آمن في أيام

اقرأ عن AWS Lake Formation

 
icon3

ابدأ البناء مع AWS

ابدأ باستخدام مخازن البيانات على AWS

انشر مخزن بيانات باستخدام AWS Lake Formation
هل لديك مزيد من الأسئلة؟
اتصل بنا