ما المقصود بالتعزيز في التعلم الآلي؟

التعزيز هو أسلوب يُستخدم في التعلم الآلي لتقليل الأخطاء في تحليل البيانات التنبئي. يدرب علماء البيانات برامج التعلم الآلي، تسمى نماذج التعلم الآلي، على البيانات المسماة لإجراء تخمينات حول بيانات غير مسماة. قد يتسبب نموذج التعلم الآلي المفرد في حدوث أخطاء في التنبؤ اعتمادًا على دقة مجموعة بيانات التدريب. على سبيل المثال، إذا تم تدريب نموذج للتعرف على القطط باستخدام صور لقطط بيضاء فقط، فقد يُخطئ أحيانًا في التعرف على قطة سوداء. يحاول التعزيز التغلب على هذه المشكلة من خلال تدريب عدة نماذج بالتتابع لتحسين دقة النظام ككل.

ما أهمية التعزيز؟

يحسن التعزيز دقة تنبؤ نماذج الآلة وأداءها من خلال تحويل عدة متعلمين ضعفاء إلى نموذج تعلم قوي فردي. يمكن لنماذج التعلم الآلي أن يكونوا متعلمين ضعفاء أو متعلمين أقوياء:

المتعلمون الضعفاء

يتسم المتعلمون الضعفاء بدقة تنبؤ منخفضة، تشبه التخمين العشوائي. وهم عرضة لفرط الملاءمة—بمعنى أنه لا يمكنهم تصنيف البيانات التي تختلف كثيرًا عن مجموعة البيانات الأصلية الخاصة بهم. على سبيل المثال، إذا دربت النموذج للتعرف على القطط كحيوانات بآذان مدببة، فقد يُخطئ في التعرف على قطة بأذنين ملتفتين.

المتعلمون الأقوياء

يتسم المتعلمون الأقوياء بدقة تنبؤ أعلى. يعمل التعزيز على تحويل نظام المتعلمين الضعفاء إلى نظام تعلم قوي فردي. على سبيل المثال، للتعرف على صورة القطة، يجمع بين متعلم ضعيف يخمن من خلال الآذان المدببة ومتعلم آخر يخمن من خلال عيون تشبه عيون القطط. بعد تحليل صورة الحيوان بناءً على الآذان المدببة، يحللها النظام مرة أخرى بناءً على العيون التي تشبه عيون القطط. هذا يحسن دقة النظام العامة.

سلسلة النقاش عبر الويب إزاء اللوغاريتم المضمنة في Amazon SageMaker: XGBoost

كيف يعمل التعزيز؟

لفهم كيفية عمل التعزيز، لنصف كيفية اتخاذ نماذج التعلم الآلي القرار. على الرغم من وجود العديد من الاختلافات في التنفيذ، فكثيرًا ما يستخدم علماء البيانات التعزيز من خلال لوغاريتمات شجرة القرار:

أشجار القرار

أشجار القرار هي هياكل بيانات في التعلم الآلي تعمل عبر تقسيم مجموعة البيانات إلى مجموعات جزئية أصغر وأصغر بناءً على ميزاتها. تكمن الفكرة في أن أشجار القرار تقسم البيانات بشكل متكرر حتى تتبقى فئة واحدة فقط. على سبيل المثال، قد تطرح الشجرة سلسلة من أسئلة نعم أو لا وتقسم البيانات إلى فئات في كل خطوة.

الأسلوب الجمعي في التعزيز

ينشئ التعزيز نموذجًا جمعيًا عن طريق جمع عدة أشجار قرار ضعيفة بالتتابع. يعين أوزانًا إلى مخرجات الأشجار الفردية. ثم يمنح التصنيفات الخاطئة من شجرة القرار الأولى وزنًا أعلى ويقوم بالإدخال إلى الشجرة التالية. بعد عدة دورات، يجمع أسلوب التعزيز هذه القواعد الضعيفة في قاعدة تنبؤ قوية واحدة.

التعزيز مقارنةً بالتعبئة

يعد التعزيز والتعبئة أسلوبين جمعيين شائعين يحسنان دقة التنبؤ. يكمن الاختلاف الأساسي بين أسلوبي التعلم هذين في أسلوب التدريب. في التعبئة، يحسن علماء البيانات دقة المتعلمين الضعفاء عن طريق تدريب العديد منهم في الوقت نفسه على مجموعات بيانات متعددة. على النقيض، يدرب التعزيز المتعلمين الضعفاء واحدًا تلو الآخر.

كيف يتم التدريب في التعزيز؟

يختلف أسلوب التدريب بناءً على نوع عملية التعزيز التي يطلق عليها لوغاريتم التعزيز. ومع ذلك، يتخذ اللوغاريتم الخطوات العامة الآتية لتدريب نموذج التعزيز:

الخطوة 1

يعين لوغاريتم التعزيز وزنًا متساويًا لكل عينة من البيانات. ويغذي نموذج الآلة الأول، الذي يطلق عليه اللوغاريتم الأساسي، بالبيانات. يجري اللوغاريتم الأساسي تنبؤات لكل عينة من البيانات.

الخطوة 2

يقيم لوغاريتم التعزيز تنبؤات النموذج ويزيد وزن العينات بخطأ أكبر. كما يعين وزنًا بناءً على أداء النموذج. النموذج الذي يخرج تنبؤات ممتازة سيكون له قدر عالٍ من التأثير في القرار النهائي.

الخطوة 3

يمرر اللوغاريتم البيانات الموزونة إلى شجرة القرار التالية.

الخطوة 4

يكرر اللوغاريتم الخطوتين 2 و3 حتى تصبح مثيلات الأخطاء في التدريب أقل من مستوى معين.

ما أنواع التعزيز؟

فيما يأتي ثلاثة أنواع رئيسية للتعزيز:

التعزيز التكيفي

كان التعزيز التكيفي (AdaBoost) من أوائل نماذج التعزيز التي تم تطويرها. حيث يتكيف ويحاول إجراء تصحيح ذاتي في كل تكرار لعملية التعزيز. 

يبدأ التعزيز التكيفي بمنح الوزن نفسه لكل مجموعة بيانات. ثم يعدل أوزان نقاط البيانات تلقائيًا بعد كل شجرة قرار. ويمنح وزنًا أكبر للعناصر المصنفة بشكل غير صحيح لتصحيحها المرة القادمة. ويكرر العملية حتى يقل الخطأ المتبقي، أو الاختلاف بين القيم الفعلية والقيم التي تم التنبؤ بها، إلى حد مقبول.

يمكنك استخدام التعزيز التكيفي مع العديد من أدوات التنبؤ، وهو ليس حساسًا تمامًا مثل لوغاريتمات التعزيز الأخرى. لا يعمل هذا النهج جيدًا عند وجود علاقة بين الميزات أو إذا كانت أبعاد البيانات عالية. بشكل عام، يعد التعزيز التكيفي نوعًا من التعزيز مناسبًا لمشكلات التصنيف.

التعزيز المتدرج

يشبه التعزيز المتدرج (GB) AdaBoost في أنه تقنية تدريب بالتتابع كذلك. يكمن الاختلاف بين AdaBoost وGB في أن GB لا يمنح العناصر المصنفة بشكل غير صحيح وزنًا أكبر. وبدلاً من ذلك، يحسن برنامج GB وظيفة الخسارة عبر إنتاج متعلمين أساسيين بالتتابع بحيث يكون المتعلم الأساسي الحالي أكثر فعالية من المتعلم السابق دائمًا. يحاول هذا الأسلوب إنتاج نتائج دقيقة في البداية بدلاً من تصحيح الأخطاء خلال العملية ككل، مثل AdaBoost. ولهذا السبب، يمكن لبرنامج GB أن يؤدي إلى نتائج أدق. يمكن أن يساعدك التعزيز المتدرج في التصنيف والمشكلات القائمة على الانحدار معًا.

التعزيز شديد التدرج

يحسن التعزيز شديد التدرج (XGBoost) التعزيز المتدرج لتحقيق السرعة والتوسع الحوسبي بطرق عديدة. يستخدم XGBoost أنوية متعددة على وحدة المعالجة المركزية بحيث يمكن للتعلم أن يحدث بالتوازي في أثناء التدريب. إنه لوغاريتم تعزيز يمكنه معالجة مجموعات بيانات موسعة، ما يجعله محل جذب لتطبيقات البيانات الضخمة. تتمثل الميزات الأساسية لـ XGBoost في التوازي والحوسبة الموزعة وتحسين ذاكرة التخزين المؤقت والمعالجة خارج النواة.

ما مزايا التعزيز؟

يوفر التعزيز مزايا الرئيسية الآتية:

سهولة التنفيذ

يتضمن التعزيز بلوغاريتمات سهلة الفهم وسهلة التفسير تتعلم من أخطائها. لا تتطلب هذه اللوغاريتمات أي معالجة سابقة للبيانات، وتتضمن روتينات مضمنة لمعالجة البيانات المفقودة. بالإضافة إلى ذلك، تتضمن معظم اللغات مكتبات مضمنة لتنفيذ لوغاريتمات التعزيز باستخدام عدة معلمات يمكنها ضبط الأداء.

تقليل التحيز

التحيز هو وجود عدم يقين أو عدم دقة في نتائج التعلم الآلي. تجمع لوغاريتمات التعزيز العديد من المتعلمين الضعفاء بأسلوب متتابع، ما يحسن الملاحظات بشكل متكرر. يساعد هذا النهج على تقليل مستوى التحيز العالي الشائع في نماذج التعلم الآلي.

الكفاءة الحوسبية

تمنح لوغاريتمات التعزيز الأولوية للميزات التي تزيد الدقة التنبئية في أثناء التدريب. يمكنها المساعدة على تقليل سمات البيانات ومعالجة مجموعات البيانات الكبيرة بكفاءة.

ما التحديات التي ينطوي عليها التعزيز؟

فيما يأتي القيود العامة لنماذج التعزيز:

تمثل ثغرة أمنية للبيانات الشاذة

تمثل نماذج التعزيز ثغرة أمنية للقيم الشاذة أو قيم البيانات التي تختلف عن بقية مجموعة البيانات. يمكن للقيم الشاذة تغيير النتائج بشكل ملحوظ، بسبب محاولة كل نموذج لتصحيح أخطائه السابقة.

التنفيذ في الوقت الفعلي

قد تجد كذلك أن استخدام التعزيز للتنفيذ في الوقت الفعلي أمرًا صعبًا حيث إن اللوغاريتم أكثر تعقيدًا من العمليات الأخرى. تتميز أساليب التعزيز بالقدرة الكبيرة على التكيف، بحيث يمكنك استخدام مجموعة كبيرة من معلمات النموذج التي تؤثر على الفور في أداء النموذج.

كيف يمكن لـ AWS مساعدتك إزاء التعزيز؟

إن خدمات إدارة الاتصالات والعلاقات المقدمة من AWS مصممة لتزويد المؤسسات بما يأتي:

Amazon SageMaker

يضم Amazon SageMaker مجموعة كبيرة من الإمكانات المصممة خصوصًا للتعلم الآلي. يمكنك استخدامه لإعداد نماذج التعلم الآلي عالية الجودة وإنشائها وتدريبها ونشرها بسرعة.

Amazon SageMaker Autopilot

يزيل Amazon SageMaker Autopilot عبء إنشاء نماذج التعلم الآلي ويساعدك على إنشاء نماذج تلقائيًا وتدريبها بناءً على بياناتك. باستخدام SageMaker Autopilot، يمكنك توفير مجموعة بيانات جدولية واختيار العمود الهدف للتنبؤ، الذي يمكن أن يكون رقمًا أو فئة. يستكشف SageMaker Autopilot تلقائيًا حلولاً مختلفة لإيجاد النموذج الأفضل. بعد ذلك، يمكنك نشر النموذج مباشرةً للإنتاج بنقرة واحدة فقط أو تكرار الحلول الموصى بها باستخدام Amazon SageMaker Studio لتحسين جودة النموذج بشكل أكبر.

مصحح أخطاء Amazon SageMaker

يجعل مصحح أخطاء Amazon SageMakerمن السهل تحسين نماذج التعلم الآلي من خلال التقاط مقاييس التدريب في الوقت الفعلي وإرسال الإشعارات عند اكتشافه الأخطاء. يساعدك ذلك على تصحيح تنبؤات النموذج غير الدقيقة على الفور، مثل التعرف غير الصحيح على صورة.

يوفر Amazon SageMaker أساليب سريعة وسهلة لتدريب نماذج تعلم عميق ومجموعات بيانات كبيرة. تدرب مكتبات التدريب الموزع الخاصة بـ SageMaker مجموعات بيانات كبيرة بشكل أسرع.

ابدأ باستخدام Amazon SageMaker عن طريق إنشاء حساب AWS اليوم.

خطوات AWS Machine Learning التالية

Standard Product Icons (Features) Squid Ink
تحقق من الموارد الإضافية المتعلقة بالمنتج
تعرف على المزيد حول خدمات التعلم الآلي 
Sign up for a free account
اطلع على خدمات التعلم الآلي المجانية

احصل على وصول فوري إلى خدمات التعلم الآلي المجانية مع طبقة AWS المجانية.

اطلع على خدمات التعلم الآلي المجانية 
Standard Product Icons (Start Building) Squid Ink
ابدأ الإنشاء في وحدة التحكم

ابدأ الإنشاء باستخدام SageMaker في وحدة إدارة تحكم AWS.

سجّل