AWS Glue

تكامل البيانات بطريقة بسيطة وبقابلية توسيع وبدون خادم

AWS Glue عبارة عن خدمة تكامل بيانات بدون خادم تسهّل اكتشاف البيانات وإعدادها ودمجها لأغراض التحليلات وتعلم الآلة وتطوير التطبيقات. توفر خدمة AWS Glue جميع الإمكانات اللازمة لتكامل البيانات بحيث يمكنك تحليل بياناتك واستخدامها في دقائق بدلاً من شهور.

يشير تكامل البيانات إلى عملية إعداد البيانات ودمجها من أجل التحليلات وتعلم الآلة وتطوير التطبيقات. وتشتمل على مهام متعددة، مثل اكتشاف البيانات واستخراجها من مصادر مختلفة؛ وإثراء البيانات وتنظيفها وتسويتها ودمجها؛ وتحميل البيانات وتنظيمها في قواعد البيانات ومستودعات البيانات ومخازن البيانات. وغالبًا ما يتم التعامل مع هذه المهام بواسطة أنواع مختلفة من المستخدمين حيث يستخدم كل منهم منتجات مختلفة.

توفر خدمة AWS Glue واجهات مرئية ومستندة إلى تعليمات برمجية لجعل تكامل البيانات أسهل. يمكن للمستخدمين العثور بسهولة على البيانات والوصول إليها باستخدام AWS Glue Data Catalog. يمكن لمهندسي البيانات ومطوري خدمات استخراج ونقل وتحميل (ETL) البيانات إنشاء مهام سير عمل خدمات استخراج ونقل وتحميل (ETL) وتشغيلها ومراقبتها بصريًا ببضع نقرات في AWS Glue Studio. وبإمكان محللي البيانات وعلماء البيانات استخدام AWS Glue DataBrew لتنظيف البيانات وتسويتها بشكل مرئي بدون كتابة تعليمات برمجية. باستخدام AWS Glue Elastic Views، يمكن لمطوري التطبيقات استخدام لغة الاستعلام المنظمة (SQL) المألوفة لدمج البيانات ونسخها عبر مخازن البيانات المختلفة.

المزايا

تكامل البيانات بشكل أسرع

يمكن للمجموعات المختلفة عبر مؤسستك استخدام خدمة AWS Glue للعمل معًا في مهام تكامل البيانات، بما في ذلك مهام سير عمل خدمات استخراج ونقل وتحميل (ETL) البيانات القابلة للتوسيع وتنظيفها وتسويتها ودمجها وتحميلها. وبهذه الطريقة، تقلل الوقت الذي تستغرقه لتحليل بياناتك واستخدامها من شهور إلى بضع دقائق.

أتمتة تكامل بياناتك على نطاق واسع

تقوم AWS Glue بأتمتة الكثير من الجهد المطلوب لتكامل البيانات. تسجل AWS Glue مصادر البيانات الخاصة بك وتحدد تنسيقاتها وتقترح المخططات لتخزينها. وتنشئ تلقائيًا التعليمة البرمجية التي تُشغّل عمليات تحويل البيانات وتحميلها. يمكنك استخدام AWS Glue لتشغيل وإدارة الآلاف من مهام استخراج ونقل وتحميل (ETL) البيانات بسهولة أو لدمج البيانات ونسخها عبر مخازن بيانات متعددة باستخدام لغة الاستعلام الهيكلية (SQL).

لا توجد خوادم لإدارتها

تعمل AWS Glue في بيئة بدون خوادم. لا توجد بنية تحتية للإدارة، كما تقوم AWS Glue بتوفير وتكوين وتوسيع الموارد المطلوبة لتشغيل مهام تكامل البيانات. تدفع فقط مقابل الموارد التي تستخدمها مهامك أثناء التشغيل.

حالات الاستخدام


بناء مسارات ETL (استخراج ونقل وتحميل البيانات) مستندة إلى الأحداث

تستطيع AWS Glue تشغيل مهام ETL مع وصول البيانات الحديثة. على سبيل المثال، يمكنك استخدام وظيفة AWS Lambda لتشغيل مهمات ETL الخاصة بك لتعمل ما إن تصبح بيانات جديدة متوفرة في Amazon S3. يمكنك أيضًا تسجيل مجموعة البيانات الجديدة هذه في دليل بيانات AWS Glue كجزء من مهام ETL الخاصة بك.

مخطط مسارات ETL المستندة إلى أحداث

إنشاء دليل موحد للعثور على البيانات عبر مخازن بيانات متعددة

يمكنك استخدام دليل بيانات AWS Glue للاكتشاف والبحث عبر مجموعات بيانات AWS المتعددة دون نقل البيانات. بمجرد تصنيف البيانات في دليل، ستصبح مباشرةً متاحة للبحث والاستعلام باستخدام Amazon Athena وAmazon EMR وAmazon Redshift Spectrum.

إنشاء وتشغيل مهام ELT في AWS Glue

إنشاء مهام ETL وتشغيلها ومراقبتها دون كتابة التعليمات البرمجية

يسهّل AWS Glue Studio من عملية إنشاء مهام ETL في AWS Glue وتشغيلها ومراقبتها بشكل مرئي. يمكنك إنشاء مهام ETL لنقل البيانات وتحويلها باستخدام محرر السحب والإفلات، ويقوم AWS Glue تلقائيًا بإنشاء التعليمات البرمجية. ويمكنك بعدها استخدام لوحة معلومات تشغيل مهام AWS Glue Studio لمراقبة تنفيذ ETL وضمان تشغيل مهامك على النحو المقصود. تعرّف على المزيد حول AWS Glue Studio من هنا.

أداة ETL مرئية لمطوّري ETL

استكشف البيانات باستخدام إعداد البيانات المرئية ذاتي الخدمة

تمكّنك AWS Glue DataBrew من استكشاف البيانات وتجربتها مباشرةً من مخازن البيانات ومستودعات البيانات وقواعد البيانات، بما يشمل Amazon S3 وAmazon Redshift وAWS Lake Formation وAmazon Aurora وAmazon RDS. يمكنك الاختيار من أكثر من 250 تحويلاً منشأ مسبقًا في AWS Glue DataBrew لأتمتة مهام تجهيز البيانات مثل تصفية حالات الخلل والتوحيد القياسي للتنسيقات وتصحيح القيم غير الصالحة. بعد تجهيز البيانات، يمكنك استخدامها فورًا للتحليلات وتعلم الآلة. تعرّف على المزيد حول AWS Glue DataBrew من هنا.

تنظيف البيانات وتسوية البيانات بصورة مرئية

إنشاء العروض المتحققة لدمج البيانات ونسخها (في المعاينة)

تمكّنك AWS Glue Elastic Views من استخدام لغة SQL مألوفة لإنشاء عروض متحققة. استخدم هذه العروض للوصول إلى البيانات ودمجها من مخازن بيانات مصدر متعددة، والحفاظ على هذه البيانات المجمعة محدثة ويمكن الوصول إليها من مخزن بيانات هدف. تدعم معاينة AWS Glue Elastic Views حاليًا Amazon DynamoDB كمصدر، مع دعم Amazon Aurora وAmazon RDS للمتابعة. الأهداف المدعومة حاليًا هي Amazon Redshift وAmazon S3 وAmazon OpenSearch Service (خدمة تخلف Amazon Elasticsearch Service)، مع دعم Amazon Aurora وAmazon RDS وAmazon DynamoDB للمتابعة. تعرّف على المزيد حول عروض AWS Glue Elastic من هنا.

تنظيف البيانات وتسوية البيانات بصورة مرئية

الميزات الجديدة

التاريخ
  • التاريخ
1
ميزات AWS Glue
التحقق من خصائص AWS Glue

تعرّف على المزيد حول أهم ميزات AWS Glue.

تعرّف على المزيد 
التسجيل للحصول على حساب AWS
قم بتسجيل الاشتراك للحصول على حساب مجاني

الوصول على الفور إلى الطبقة المجانية لخدمة AWS. 

التسجيل 
بدء الإنشاء في وحدة التحكم
بدء الإنشاء في AWS Glue

ابدأ الإنشاء باستخدام AWS Glue في الواجهة المرئية لبيئة التطوير المتكاملة.

تسجيل الدخول