لماذا AWS Glue؟
يعد إعداد بياناتك للحصول على نتائج عالية الجودة الخطوة الأولى في مشروع التحليلات أو تعلّم الآلة. AWS Glue هي خدمة تكامل بيانات بلا خادم تجعل إعداد البيانات أبسط وأسرع وأرخص. يمكنك اكتشاف أكثر من 70 مصدرًا متنوعًا للبيانات والاتصال بها، كما يمكنك إدارة بياناتك في كتالوج بيانات مركزي وإنشاء بصريًا مسارات ETL وتشغيلها ومراقبتها لتحميل البيانات في مخازن بياناتك.
مقدمة إلى AWS Glue (‏01:54)

فوائد AWS Glue

إمكانيات تكامل البيانات الكاملة في خدمة واحدة بلا خادم
تدعم جميع مستخدمي البيانات بدايةً من المطورين إلى المستخدمين في قطاع الأعمال
تحجيم البيتابايت، وفوترة الدفع مقابل الاستخدام، أي حجم بيانات
دعم مرن للاستخراج والانتقال والتحميل (ETL) والاستخراج والتحميل والتحويل (ELT) والدفعات والتدفق والمزيد، من دون تقييد

كيفية العمل

AWS Glue هي خدمة تكامل بيانات بلا خادم تسهّل اكتشاف البيانات وإعدادها ونقلها ودمجها من مصادر متعددة للإجراء التحليلات واستخدام تعلّم الآلة (ML) وتطوير التطبيقات.

  • خيارات محرك تكامل البيانات
  • اختر محرك تكامل البيانات المفضل لديك في AWS Glue لدعم المستخدمين وأعباء العمل لديك.

    يوضح الرسم التخطيطي خيارات متعددة لمحرك معالجة البيانات لخدمة AWS Glue.
  • مسارات ETL المستندة إلى الأحداث
  • يمكن لخدمة AWS Glue تشغيل وظائف الاستخراج والانتقال والتحميل (ETL) مع وصول البيانات الجديدة. على سبيل المثال، يمكنك تكوين AWS Glue لتشغيل مهام ETL الخاصة بك بمجرد توفر بيانات جديدة في خدمة التخزين البسيطة في Amazon (‏Amazon S3).

    رسم تخطيطي يوضح كيف يمكن لخدمة AWS Glue تشغيل وظائف ETL الخاصة بك مع وصول البيانات الجديدة.
  • كتالوج بيانات AWS Glue
  • يمكنك استخدام كتالوج البيانات لاكتشاف مجموعات بيانات AWS المتعددة والبحث فيها بسرعة بدون نقل البيانات. بمجرد فهرسة البيانات، تصبح متاحة على الفور للبحث والاستعلام باستخدام Amazon Athena وAmazon EMR وAmazon Redshift Spectrum.

    رسم تخطيطي يوضح اكتشاف كتالوج البيانات والبحث في مجموعات البيانات بدون نقل البيانات.
  • مهام ETL بدون رموز برمجية
  • يُسهل AWS Glue Studio إنشاء مهام AWS Glue ETL وتشغيلها ومراقبتها مرئيًا. يمكنك إنشاء مهام ETL لنقل البيانات وتحويلها باستخدام محرر السحب والإفلات، وينشئ AWS Glue تلقائيًا التعليمات البرمجية.

    رسم تخطيطي يوضح كيف يمكن للمستخدمين تكوين مهام ETL لنقل البيانات وتحويلها باستخدام محرر السحب والإفلات.
  • إدارة جودة البيانات ومراقبتها
  • تعمل AWS Glue Data Quality على أتمتة إنشاء قواعد جودة البيانات وإدارتها ومراقبتها للمساعدة في ضمان بيانات عالية الجودة بين مخازن البيانات والمسارات المتعددة.

    يوضح الرسم التخطيطي كيف تقيس AWS Glue Data Quality جودة البيانات وتراقبها وتديرها تلقائيًا في مخازن البيانات ومسارات البيانات.
  • تجهيز البيانات
  • باستخدام AWS Glue DataBrew، يمكنك استكشاف البيانات وتجربتها مباشرةً من مخازن البيانات ومستودعات البيانات وقواعد البيانات، بما في ذلك Amazon S3 وAmazon Redshift وAWS Lake Formation وAmazon Aurora وAmazon Relational Database Service (RDS). يمكنك الاختيار من بين أكثر من 250 تحويلًا تم إنشاؤه مسبقًا في DataBrew لأتمتة مهام إعداد البيانات، مثل تصفية الحالات الشاذة وتوحيد التنسيقات وتصحيح القيم غير الصالحة.

    رسم تخطيطي يوضح كيفية قيام DataBrew بالتشغيل الآلي لمهام إعداد البيانات للمستخدمين.

حالات الاستخدام

تبسيط تطوير مسار عملية الاستخراج والتحويل والتحميل (ETL)

Remove infrastructure management with automatic provisioning and worker management, and consolidate all your data integration needs into a single service.

دعم العديد من أطر المعالجة وأعباء العمل

More easily support various data processing frameworks, such as ETL and ELT, and various workloads, including batch, micro-batch, and streaming.

الكفاءة في استكشاف البيانات

Quickly identify data across AWS, on premises, and other clouds, and then make it instantly available for querying and transforming.

استكشاف البيانات وتجربتها ومعالجتها بطريقة تفاعلية

Using AWS Glue interactive sessions, data engineers can interactively explore and prepare data using the integrated development environment (IDE) or notebook of their choice.

ما الجديد

  • التاريخ (من الأحدث إلى الأقدم)
لم يتم العثور على نتائج
1

استكشف المزيد حول AWS