ما المقصود بالانحدار اللوجستي؟
الانحدار اللوجستي هو تقنية لتحليل البيانات تستخدم الرياضيات في إيجاد العلاقات بين عامِلَين من عوامل البيانات. ثم يستخدم هذه العلاقة للتنبؤ بقيمة أحد هذين العامِلَين بناءً على الآخر. وعادة ما يكون للتنبؤ عددًا محدودًا (قيمة نهائية) من النتائج، مثل نعم أو لا.
على سبيل المثال، لنفترض أنك تريد تخمين ما إذا كان زائر موقع الويب سينقر على زر "السداد وإتمام عملية الشراء" في عربة التسوق الخاصة به أم لا. يبحث تحليل الانحدار اللوجستي في سلوك الزوار في السابق، مثل الوقت الذي يقضونه على موقع الويب وعدد العناصر في سلة التسوق. ويقرر أنه في السابق، إن قضى الزوار أكثر من خمس دقائق على الموقع وأضافوا أكثر من ثلاثة عناصر إلى سلة التسوق، فسينقرون على زر "السداد وإتمام عملية الشراء". باستخدام هذه المعلومات، يمكن لوظيفة الانحدار اللوجستي التنبؤ بسلوك أحد الزوّار الجدد لموقع الويب.
لماذا يعتبر الانحدار اللوجستي مهمًا؟
التراجع اللوجستي هو تقنية مهمة في مجال الذكاء الاصطناعي والتعلم الآلي (AI/ML). نماذج التعلم الآلي (ML) هي برامج يمكنك تدريبها لأداء مهام معالجة البيانات المعقدة دون تدخل بشري. تساعد نماذج التعلم الآلي التي تم إنشاؤها باستخدام الانحدار اللوجستي المؤسسات على اكتساب رؤى قابلة للتنفيذ من بيانات أعمالها. يمكنهم استخدام هذه الأفكار للتحليل التنبؤي لتقليل التكاليف التشغيلية وزيادة الكفاءة والتوسع بشكل أسرع. على سبيل المثال، يمكن للشركات الكشف عن الأنماط التي تحسن الاحتفاظ بالموظفين أو تؤدي إلى تصميم منتج أكثر ربحية.
أدناه، نسرد بعض فوائد استخدام الانحدار اللوجستي على تقنيات ML الأخرى.
البساطة
نماذج الانحدار اللوجستي أقل تعقيدًا من الناحية الرياضية من طرق التعليم الآلي (ML) الأخرى. لذلك، يمكنك تنفيذها حتى لو لم يكن لدى أي شخص في فريقك خبرة متعمقة في التعلم الآلي.
السرعة
يمكن لنماذج الانحدار اللوجستي معالجة كميات كبيرة من البيانات بسرعة عالية لأنها تتطلب قدرة حسابية أقل، مثل الذاكرة وقوة المعالجة. هذا يجعلها مثالية للمؤسسات التي تبدأ بمشاريع ML لتحقيق بعض المكاسب السريعة.
المرونة
يمكنك استخدام الانحدار اللوجستي للعثور على إجابات للأسئلة التي لها نتيجتان محددتان أو أكثر. يمكنك أيضًا استخدامه لمعالجة البيانات مسبقًا. على سبيل المثال، يمكنك فرز البيانات بنطاق كبير من القيم، مثل المعاملات المصرفية، إلى نطاق محدود أصغر من القيم باستخدام الانحدار اللوجستي. يمكنك بعد ذلك معالجة مجموعة البيانات الأصغر هذه باستخدام تقنيات التعلم الآلي الأخرى لتحليل أكثر دقة.
الرؤية
يمنح تحليل الانحدار اللوجستي المطورين رؤية أكبر لعمليات البرامج الداخلية مقارنة بتقنيات تحليل البيانات الأخرى. كما أن استكشاف الأخطاء وإصلاحها وتصحيح الأخطاء أسهل أيضًا لأن الحسابات أقل تعقيدًا.
ما هي تطبيقات الانحدار اللوجستي؟
يحتوي الانحدار اللوجستي على العديد من التطبيقات الواقعية في العديد من الصناعات المختلفة.
التصنيع
تستخدم شركات التصنيع تحليل الانحدار اللوجستي لتقدير احتمالية فشل الأجزاء في الآلات. ثم يخططون لجداول الصيانة بناءً على هذا التقدير لتقليل حالات الفشل المستقبلية.
الرعاية الصحية
يخطط الباحثون الطبيون للرعاية الوقائية والعلاج من خلال التنبؤ باحتمالية إصابة المريض بالمرض. فيستخدمون نماذج الانحدار اللوجستي لمقارنة تأثير تاريخ العائلة أو الجينات على الأمراض.
التمويل
يتعين على الشركات المالية تحليل المعاملات المالية بحثًا عن الاحتيال وتقييم طلبات القروض وطلبات التأمين للمخاطر. هذه المشاكل مناسبة لنموذج الانحدار اللوجستي لأن لها نتائج منفصلة، مثل المخاطر العالية أو المخاطر المنخفضة والاحتيال أو غير الاحتيالي.
التسويق
تستخدم أدوات الإعلان عبر الإنترنت نموذج الانحدار اللوجستي للتنبؤ بما إذا كان المستخدمون سينقرون على إعلان. ونتيجة لذلك، يمكن للمسوقين تحليل ردود المستخدمين على الكلمات والصور المختلفة وإنشاء إعلانات عالية الأداء يشارك فيها العملاء.
كيف يعمل تحليل الانحدار؟
الانحدار اللوجستي هو واحد من العديد من تقنيات تحليل الانحدار المختلفة التي يستخدمها علماء البيانات بشكل شائع في التعلم الآلي (ML). لفهم الانحدار اللوجستي، يجب علينا أولاً فهم تحليل الانحدار الأساسي. أدناه، نستخدم مثالاً لتحليل الانحدار الخطي لتوضيح كيفية عمل تحليل الانحدار.
تحديد السؤال
يبدأ أي تحليل للبيانات بسؤال تجاري. وبالنسبة للانحدار اللوجستي، يجب عليك وضع السؤال في إطار للحصول على نتائج معينة:
- هل تؤثر الأيام الممطرة على مبيعاتنا الشهرية؟ (نعم أو لا)
- ما نوع نشاط بطاقة الائتمان الذي يؤديه العميل؟ (مصرح به أو احتيالي أو يحتمل أن يكون احتياليًا)
جمع البيانات التاريخية
بعد تحديد السؤال، تحتاج إلى تحديد عوامل البيانات المعنية. ستقوم بعد ذلك بجمع البيانات السابقة لجميع العوامل. على سبيل المثال، للإجابة على السؤال الأول الموضح أعلاه، يمكنك جمع عدد الأيام الممطرة وبيانات مبيعاتك الشهرية لكل شهر في السنوات الثلاث الماضية.
تدريب نموذج تحليل الانحدار
ستقوم بمعالجة البيانات التاريخية باستخدام برنامج الانحدار. سيقوم البرنامج بمعالجة نقاط البيانات المختلفة وربطها رياضيًا باستخدام المعادلات. على سبيل المثال، إذا كان عدد الأيام الممطرة لمدة ثلاثة أشهر هو 3 و 5 و 8 وكان عدد المبيعات في تلك الأشهر 8 و 12 و 18، فإن خوارزمية الانحدار ستربط العوامل بالمعادلة:
عدد المبيعات = 2* (عدد الأيام الممطرة) + 2
التنبؤ بقيم غير معروفة
بالنسبة للقيم غير المعروفة، يستخدم البرنامج معادلة للتنبؤ بها. إذا كنت تعلم أنها ستمطر لمدة ستة أيام في يوليو، فسيقدر البرنامج قيمة بيع يوليو بـ 14.
كيف يعمل نموذج الانحدار اللوجستي؟
لفهم نموذج الانحدار اللوجستي، دعونا أولاً نفهم المعادلات والمتغيرات.
معادلات
في الرياضيات، تعطي المعادلات العلاقة بين متغيرين: x و y. يمكنك استخدام هذه المعادلات، أو الدوال، لرسم رسم بياني على طول المحور السيني والمحور الصادي عن طريق وضع قيم مختلفة لـ x و y. على سبيل المثال، إذا قمت برسم الرسم البياني للدالة y = 2* x، فستحصل على خط مستقيم كما هو موضح أدناه. ومن ثم تسمى هذه الوظيفة أيضًا وظيفة خطية.
المتغيرات
في الإحصائيات، المتغيرات هي عوامل البيانات أو السمات التي تختلف قيمها. بالنسبة لأي تحليل، تكون بعض المتغيرات متغيرات مستقلة أو توضيحية. هذه السمات هي سبب النتيجة. المتغيرات الأخرى هي متغيرات تابعة أو استجابة؛ تعتمد قيمها على المتغيرات المستقلة. بشكل عام, يستكشف الانحدار اللوجستي كيف تؤثر المتغيرات المستقلة على متغير تابع واحد من خلال النظر في قيم البيانات التاريخية لكلا المتغيرين.
في المثال أعلاه، يسمى x المتغير المستقل أو متغير التنبؤ أو المتغير التوضيحي لأنه يحتوي على قيمة معروفة. يسمى Y المتغير التابع أو متغير النتيجة أو متغير الاستجابة لأن قيمته غير معروفة.
دالة الانحدار اللوجستي
الانحدار اللوجستي هو نموذج إحصائي يستخدم الدالة اللوجيستية، أو دالة اللوجيستية، في الرياضيات كمعادلة بين x وy. تقوم دالة logit بتعيين y كدالة سينية لـ x.
إذا قمت برسم معادلة الانحدار اللوجستي هذه، فستحصل على منحنى S كما هو موضح أدناه.
كما ترى، تقوم الدالة logit بإرجاع القيم فقط بين 0 و 1 للمتغير التابع، بغض النظر عن قيم المتغير المستقل. هذه هي الطريقة التي يقدر بها الانحدار اللوجستي قيمة المتغير التابع. تقوم طرق الانحدار اللوجستي أيضًا بنمذجة المعادلات بين متغيرات مستقلة متعددة ومتغير تابع واحد.
تحليل الانحدار اللوجستي مع متغيرات مستقلة متعددة
في كثير من الحالات، تؤثر المتغيرات التوضيحية المتعددة على قيمة المتغير التابع. لنمذجة مجموعات البيانات المدخلة هذه، تفترض صيغ الانحدار اللوجستي علاقة خطية بين المتغيرات المستقلة المختلفة. يمكنك تعديل الدالة السيني وحساب متغير الإخراج النهائي
y = f(β0 + β1x1 + β2x2+… βnxn)
يمثل الرمز β معامل الانحدار. يمكن لنموذج logit عكس حساب قيم المعامل هذه عندما تعطيه مجموعة بيانات تجريبية كبيرة بما فيه الكفاية مع قيم معروفة لكل من المتغيرات التابعة والمستقلة.
سجل الاحتمالات
يمكن أن يحدد نموذج logit أيضًا نسبة النجاح إلى الفشل أو احتمالات السجل. فمثلا, إذا كنت تلعب البوكر مع أصدقائك وفزت بأربع مباريات من أصل 10, احتمالات فوزك هي أربعة أسداس, أو أربعة من أصل ستة, وهي نسبة نجاحك إلى الفشل. احتمال الفوز، من ناحية أخرى، هو أربعة من أصل 10.
رياضيا، احتمالاتك من حيث الاحتمال هي p/(1 - p)، واحتمالات السجل الخاصة بك هي log (p/(1 - p)). يمكنك تمثيل الوظيفة اللوجستية كاحتمالات سجل كما هو موضح أدناه:
ما هي أنواع تحليل الانحدار اللوجستي؟
هناك ثلاث طرق لتحليل الانحدار اللوجستي بناءً على نتائج المتغير التابع.
ما المقصود بالانحدار اللوجستي؟
يعمل الانحدار اللوجستي الثنائي بشكل جيد لمشاكل التصنيف الثنائي التي لها نتيجتان محتملتان فقط. يمكن أن يحتوي المتغير التابع على قيمتين فقط، مثل نعم ولا أو 0 و 1.
على الرغم من أن الدالة اللوجيستية تحسب نطاقًا من القيم بين 0 و 1، فإن نموذج الانحدار الثنائي يقرب الإجابة إلى أقرب القيم. بشكل عام، يتم تقريب الإجابات أدناه 0.5 إلى 0، ويتم تقريب الإجابات فوق 0.5 إلى 1، بحيث تقوم الدالة اللوجيستية بإرجاع نتيجة ثنائية.
الانحدار اللوجستي متعدد الحدود
يمكن للانحدار متعدد الحدود تحليل المشكلات التي لها العديد من النتائج المحتملة طالما أن عدد النتائج محدود. على سبيل المثال، يمكنها التنبؤ بما إذا كانت أسعار المنازل سترتفع بنسبة 25٪ أو 50٪ أو 75٪ أو 100٪ بناءً على بيانات السكان، لكنها لا تستطيع التنبؤ بالقيمة الدقيقة للمنزل.
يعمل الانحدار اللوجستي متعدد الحدود عن طريق تعيين قيم النتائج إلى قيم مختلفة بين 0 و 1. نظرًا لأن الوظيفة اللوجستية يمكنها إرجاع نطاق من البيانات المستمرة، مثل 0.1 و 0.11 و 0.12 وما إلى ذلك، فإن الانحدار متعدد الحدود يقوم أيضًا بتجميع الإخراج إلى أقرب القيم الممكنة.
الانحدار اللوجستي الترتيبي
الانحدار اللوجستي الترتيبي, أو نموذج logit المرتب, هو نوع خاص من الانحدار متعدد الحدود للمشاكل التي تمثل فيها الأرقام الرتب بدلاً من القيم الفعلية. على سبيل المثال، يمكنك استخدام الانحدار الترتيبي للتنبؤ بالإجابة على سؤال استطلاع يطلب من العملاء تصنيف خدمتك على أنها سيئة أو عادلة أو جيدة أو ممتازة بناءً على قيمة عددية، مثل عدد العناصر التي يشترونها منك على مدار العام.
كيف يقارن الانحدار اللوجستي بتقنيات التعلم الآلي الأخرى؟
تقنيتان شائعتان لتحليل البيانات هما تحليل الانحدار الخطي والتعلم العميق.
تحليل الانحدار الخطي
كما هو موضح أعلاه، نماذج الانحدار الخطي العلاقة بين المتغيرات التابعة والمستقلة باستخدام تركيبة خطية. معادلة الانحدار الخطي هي
y= β0X0 + β1X1 + β2X2+… βnXn+ ε, حيث β1 to βn وε هي معاملات الانحدار.
الانحدار اللوجستي مقابل الانحدار الخطي
يتنبأ الانحدار الخطي بمتغير تابع مستمر باستخدام مجموعة معينة من المتغيرات المستقلة. يمكن أن يحتوي المتغير المستمر على مجموعة من القيم، مثل السعر أو العمر. لذلك يمكن أن يتنبأ الانحدار الخطي بالقيم الفعلية للمتغير التابع. يمكن أن يجيب على أسئلة مثل «ماذا سيكون سعر الأرز بعد 10 سنوات؟ «
على عكس الانحدار الخطي، فإن الانحدار اللوجستي هو خوارزمية تصنيف. لا يمكن التنبؤ بالقيم الفعلية للبيانات المستمرة. يمكنه الإجابة على أسئلة مثل «هل سيرتفع سعر الأرز بنسبة 50٪ خلال 10 سنوات؟ «
التعليم العميق
يستخدم التعلم العميق الشبكات العصبية أو مكونات البرامج التي تحاكي الدماغ البشري لتحليل المعلومات. تعتمد حسابات التعلم العميق على المفهوم الرياضي للمتجهات.
الانحدار اللوجستي مقابل التعلم العميق
الانحدار اللوجستي أقل تعقيدًا وأقل كثافة في الحوسبة من التعلم العميق. والأهم من ذلك، أن حسابات التعلم العميق لا يمكن التحقيق فيها أو تعديلها من قبل المطورين، نظرًا لطبيعتها المعقدة التي تحركها الآلة. من ناحية أخرى، حسابات الانحدار اللوجستي شفافة وأسهل لاستكشاف الأخطاء وإصلاحها.
كيف يمكنك تشغيل تحليل الانحدار اللوجستي على AWS؟
يمكنك تشغيل التراجع اللوجستي على AWS باستخدام Amazon SageMaker. SageMaker هي خدمة تعلم آلي مُدارة بالكامل (ML) مع خوارزميات مدمجة للانحدار الخطي والانحدار اللوجستي، من بين العديد من حزم البرامج الإحصائية الأخرى.
- يمكن لكل عالم بيانات استخدام SageMaker لإعداد وبناء وتدريب ونشر نماذج الانحدار اللوجستي بسرعة.
- تزيل SageMaker عبء العمل من كل خطوة من عملية تعلم الآلة لتسهيل تطوير النماذج عالية الجودة.
- يوفر SageMaker جميع المكونات التي تحتاجها للانحدار اللوجستي في مجموعة أدوات واحدة بحيث يمكنك الحصول على نماذج للإنتاج بشكل أسرع وأسهل وبتكلفة أقل.
ابدأ بالانحدار اللوجستي من خلال إنشاء حساب AWS اليوم.