ما المقصود بالتعزيز في التعلم الآلي؟

التعزيز هو أسلوب يُستخدم في التعلم الآلي لتقليل الأخطاء في تحليل البيانات التنبؤي. يدرب علماء البيانات برامج التعلم الآلي، تسمى نماذج التعلم الآلي، على البيانات المسماة لإجراء تخمينات حول البيانات غير مسماة. قد يتسبب نموذج التعلم الآلي المفرد في حدوث أخطاء في التنبؤ اعتمادًا على دقة مجموعة بيانات التدريب. على سبيل المثال، إذا تم تدريب نموذج للتعرف على القطط باستخدام صور لقطط بيضاء فقط، فقد يُخطئ أحيانًا في التعرف على قطة سوداء. يحاول التعزيز التغلب على هذه المشكلة من خلال تدريب عدة نماذج بالتتابع لتحسين دقة النظام كله.

ما أهمية التعزيز؟

يحسن التعزيز دقة تنبؤ نماذج الآلة وأداءها من خلال تحويل عدة متعلمين ضعفاء إلى نموذج تعلم قوي فردي. يمكن لنماذج التعلم الآلي أن يكونوا متعلمين ضعفاء أو متعلمين أقوياء:

المتعلمون الضعفاء

يتسم المتعلمون الضعفاء بدقة تنبؤ منخفضة، تشبه التخمين العشوائي. وهم عرضة لفرط الملاءمة—بمعنى أنه لا يمكنهم تصنيف البيانات التي تختلف كثيرًا عن مجموعة البيانات الأصلية الخاصة بهم. على سبيل المثال، إذا دربت النموذج للتعرف على القطط كحيوانات بآذان مدببة، فقد يُخطئ في التعرف على قطة بأذنين ملتفتين.

المتعلمون الأقوياء

يتسم المتعلمون الأقوياء بدقة تنبؤ أعلى. يعمل التعزيز على تحويل نظام المتعلمين الضعفاء إلى نظام تعلم قوي فردي. على سبيل المثال، للتعرف على صورة القطة، يجمع بين متعلم ضعيف يخمن من خلال الآذان المدببة ومتعلم آخر يخمن من خلال عيون تشبه عيون القطط. بعد تحليل صورة الحيوان بناءً على الآذان المدببة، يحللها النظام مرة أخرى بناءً على العيون التي تشبه عيون القطط. هذا يحسن دقة النظام العامة.

كيف يعمل التعزيز؟

لفهم كيفية عمل التعزيز، لنصف كيفية اتخاذ نماذج التعلم الآلي القرار. على الرغم من وجود العديد من الاختلافات في التنفيذ، فكثيرًا ما يستخدم علماء البيانات التعزيز من خلال لوغاريتمات شجرة القرار:

أشجار القرار

أشجار القرار هي هياكل بيانات في التعلم الآلي تعمل عبر تقسيم مجموعة البيانات إلى مجموعات جزئية أصغر وأصغر بناءً على ميزاتها. تكمن الفكرة في أن أشجار القرار تقسم البيانات بشكل متكرر حتى تتبقى فئة واحدة فقط. على سبيل المثال، قد تطرح الشجرة سلسلة من أسئلة نعم أو لا وتقسم البيانات إلى فئات في كل خطوة.

الأسلوب الجمعي في التعزيز

ينشئ التعزيز نموذجًا جمعيًا عن طريق جمع عدة أشجار قرار ضعيفة بالتتابع. يعين أوزانًا إلى مخرجات الأشجار الفردية. ثم يمنح التصنيفات الخاطئة من شجرة القرار الأولى وزنًا أعلى ويقوم بالإدخال إلى الشجرة التالية. بعد عدة دورات، يجمع أسلوب التعزيز هذه القواعد الضعيفة في قاعدة تنبؤ قوية واحدة.

التعزيز مقارنةً بالتعبئة

يعد التعزيز والتعبئة أسلوبين جمعيين شائعين يحسنان دقة التنبؤ. يكمن الاختلاف الأساسي بين أسلوبي التعلم هذين في أسلوب التدريب. في التعبئة، يحسن علماء البيانات دقة المتعلمين الضعفاء عن طريق تدريب العديد منهم في الوقت نفسه على مجموعات بيانات متعددة. على النقيض، يدرب التعزيز المتعلمين الضعفاء واحدًا تلو الآخر.

 

كيف يتم التدريب في التعزيز؟

يختلف أسلوب التدريب بناءً على نوع عملية التعزيز التي يطلق عليها لوغاريتم التعزيز. ومع ذلك، يتخذ اللوغاريتم الخطوات العامة الآتية لتدريب نموذج التعزيز:

الخطوة 1

يعين لوغاريتم التعزيز وزنًا متساويًا لكل عينة من البيانات. ويغذي نموذج الآلة الأول، الذي يطلق عليه اللوغاريتم الأساسي، بالبيانات. يجري اللوغاريتم الأساسي تنبؤات لكل عينة من البيانات.

الخطوة 2

يقيم لوغاريتم التعزيز تنبؤات النموذج ويزيد وزن العينات بخطأ أكبر. كما يعين وزنًا بناءً على أداء النموذج. النموذج الذي يخرج تنبؤات ممتازة سيكون له قدر عالٍ من التأثير في القرار النهائي.

الخطوة 3

يمرر اللوغاريتم البيانات الموزونة إلى شجرة القرار التالية.

الخطوة 4

يكرر اللوغاريتم الخطوتين 2 و3 حتى تصبح مثيلات الأخطاء في التدريب أقل من مستوى معين.

الخطوات التالية لتعلّم الآلة في AWS