ما المقصود بنماذج التراجع التلقائي؟
نماذج التراجع التلقائي هي فئة من نماذج تعلّم الآلة (ML) التي تتنبأ تلقائيًا بالمكون التالي في التسلسل من خلال أخذ القياسات من المدخلات السابقة في التسلسل. التراجع التلقائي هو أسلوب إحصائي يُستخدم في تحليل السلاسل الزمنية مفترضًا أن القيمة الحالية للسلسلة الزمنية هي دالة لقيمها السابقة. وتستخدم نماذج التراجع التلقائي أساليب رياضية مماثلة لتحديد الارتباط الاحتمالي بين العناصر في التسلسل، ثم تستخدم المعرفة المكتسبة لتخمين العنصر التالي في تسلسل غير معروف. على سبيل المثال، في أثناء التدريب، يعالج نموذج التراجع التلقائي العديد من جمل اللغة الإنجليزية ويحدد أن كلمة "is" تتبع دائمًا كلمة "there". ثم ينشئ تسلسلاً جديدًا يحتوي على الكلمتين "there is" معًا.
كيف تُستخدم نماذج التراجع التلقائي في الذكاء الاصطناعي المولّد؟
الذكاء الاصطناعي المولّد (generative AI) هو تقنية متقدمة لعلم البيانات قادرة على إنشاء محتوى جديد وفريد من خلال التعلم من بيانات تدريب هائلة الحجم. وتوضح الأقسام التالية كيف تتيح نمذجة التراجع التلقائي تطبيقات الذكاء الاصطناعي المولّد.
معالجة اللغة الطبيعية (NLP)
تُعد نمذجة التراجع التلقائي مكونًا مهمًا لنماذج اللغة الكبيرة (LLM). وتُشغل نماذج اللغة الكبيرة بواسطة المحول المولّد المدَّرب مسبقًا (GPT)، وهو شبكة عصبونية عميقة مشتقة من بنية المحولات. ويتكون المحول من وحدة فك ترميز تتيح فهم اللغة الطبيعية وتوليد اللغة الطبيعية، على التوالي. لا يستخدم GPT وحدة فك الترميز إلا لنمذجة لغة التراجع التلقائي. وهذا يسمح له بفهم اللغات الطبيعية والاستجابة بطرق يفهمها البشر. ويتنبأ نموذج اللغة الكبير المشغل بـ GPT بالكلمة التالية من خلال النظر في التوزيع الاحتمالي لمجموعة النصوص التي دُرِّب عليها.
القراءة عن معالجة اللغة الطبيعية (NLP)
القراءة عن نماذج اللغات الكبيرة (LLMs)
تركيب الصور
يسمح التراجع التلقائي لنماذج التعليم العميق بإنشاء الصور من خلال تحليل معلومات محدودة. وتستخدم الشبكات العصبونية لمعالجة الصور، مثل PixelRNN وPixelCNN، نمذجة التراجع التلقائي للتنبؤ بالبيانات المرئية من خلال فحص معلومات البكسل الحالية. ويمكنك استخدام تقنيات التراجع التلقائي لزيادة حدة الصور وترقية حجمها وإعادة بنائها مع الحفاظ على الجودة.
التنبؤ بالسلاسل الزمنية
نماذج التراجع التلقائي مفيدة في التنبؤ باحتمالية أحداث السلاسل الزمنية. على سبيل المثال، تستخدم نماذج التعليم العميق تقنيات التراجع التلقائي للتنبؤ بأسعار الأسهم والطقس والأحوال المرورية بناءً على القيم التاريخية، أي السابقة.
زيادة البيانات
يدرِّب مهندسو تعلّم الآلة (ML) نماذج الذكاء الاصطناعي (AI) باستخدام مجموعات بيانات منسقة لتحسين الأداء. في بعض الحالات، لا تكون هناك بيانات كافية لتدريب النموذج بشكل مناسب. يستخدم المهندسون نماذج التراجع التلقائي لإنشاء بيانات تدريب للتعليم العميق تتسم بالحداثة والواقعية. ويستخدمون البيانات المنشأة لزيادة مجموعات بيانات التدريب المحدودة الحالية.
ما آلية عمل نموذج التراجع التلقائي؟
يستخدم نموذج التراجع التلقائي أحد متغيرات تحليلات التراجع الخطي من أجل التنبؤ بالتسلسل التالي من نطاق معين من المتغيرات. في تحليل التراجع، يُزوَّد النموذج الإحصائي بالعديد من المتغيرات المستقلة، التي يستخدمها للتنبؤ بقيمة المتغير التابع.
التراجع الخطي
يمكنك تخيل التراجع الخطي كرسم خط مستقيم يمثل القيم المتوسطة الموزعة على رسم بياني ثنائي الأبعاد أفضل تمثيل. من الخط المستقيم، ينشئ النموذج نقطة بيانات جديدة تتوافق مع التوزيع الشرطي للقيم السابقة.
تأمل أبسط صيغة لمعادلة الرسم البياني الخطي بين y (المتغير التابع) وx (المتغير المستقل)؛ وهي المعادلة y=m*x+c، حيث يكون c وm ثابتين لكل القيم الممكنة لـ x وy. ولذلك، على سبيل المثال، إذا كانت مجموعة بيانات الإدخال لـ (x، y) هي (1,5)، و(2,8)، و(3,11). لتحديد طريقة التراجع الخطي، يمكنك تنفيذ الخطوات التالية:
- رسم خط مستقيم، وقياس الارتباط بين 1 و5.
- تغيير اتجاه الخط المستقيم للقيم الجديدة (2,8) و(3,11) إلى أن تتناسب جميع القيم.
- تحديد معادلة الانحدار الخطي بالمعادلة y=3*x+2.
- استقراء أو توقع أن y هي 14 عندما تكون x هي 4.
التراجع التلقائي
نماذج التراجع التلقائي تطبق التراجع الخطي مع المتغيرات المتأخرة لمخرجاتها الناتجة عن الخطوات السابقة. وعلى عكس التراجع الخطي، لا يستخدم نموذج الانحدار الذاتي متغيرات مستقلة أخرى باستثناء النتائج المتوقعة مسبقًا. تأمل المعادلة التالية.
عند التعبير عن نموذج التراجع التلقائي بالمصطلح الاحتمالي، فإنه يوزع المتغيرات المستقلة على n من الخطوات الممكنة، بافتراض أن المتغيرات السابقة تؤثر بشكل مشروط على نتيجة المتغير التالي.
يمكننا أيضًا التعبير عن نمذجة التراجع التلقائي بالمعادلة الواردة أدناه.
هنا، y عبارة عن نتيجة التنبؤ لترتيبات متعددة للنتائج السابقة مضروبة في معاملات كل منها، ϕ. المعامل يمثل الأوزان أو المعلمات التي تؤثر على أهمية المتنبئ بالنسبة للنتيجة التالية. تأخذ المعادلة أيضًا في الاعتبار التشويش العشوائي التي قد تؤثر على التنبؤ، مما يشير إلى أن النموذج ليس مثاليًا وأنه من الممكن إجراء مزيد من التحسينات.
تأخر
يضيف علماء البيانات المزيد من القيم المتأخرة لتحسين دقة نموذج التراجع التلقائي. وهم يفعلون ذلك عن طريق زيادة قيمة t، التي تشير إلى عدد الخطوات في السلسلة الزمنية للبيانات. وكلما ارتفع عدد الخطوات، ازدادت إمكانية التقاط النموذج لمقدار أكبر من التنبؤات السابقة كمدخلات. على سبيل المثال، يمكنك توسيع نموذج التراجع التلقائي ليشمل درجة الحرارة المتوقعة من 7 أيام إلى آخر 14 يومًا للحصول على نتيجة أكثر دقة. ومع ذلك، فإن زيادة الترتيب المتأخر لنموذج التراجع التلقائي لا يؤدي دائمًا إلى تحسين الدقة. وإذا كان المعامل قريبًا من الصفر، فإنه يكون للمتنبئ المحدد تأثير ضئيل على نتيجة النموذج. علاوة على ذلك، فإن توسيع التسلسل إلى أجل غير مسمى يؤدي إلى نموذج أكثر تعقيدًا يتطلب مزيدًا من موارد الحوسبة من أجل التشغيل.
ما المقصود بالارتباط التلقائي؟
الارتباط التلقائي هو طريقة إحصائية تقيِّم مدى قوة تأثر ناتج نموذج التراجع التلقائي بمتغيراته المتأخرة. يستخدم علماء البيانات الارتباط التلقائي لوصف العلاقة بين النواتج والمدخلات المتأخرة للنموذج. كلما زاد الارتباط، زادت دقة التنبؤ بالنموذج. فيما يلي بعض الاعتبارات المتعلقة بالارتباط التلقائي:
- يُقصد من الارتباط الإيجابي أن الناتج يتبع الاتجاهات المرسومة بناءً على القيم السابقة. على سبيل المثال، يتنبأ النموذج بأن سعر السهم سيرتفع اليوم لأنه ارتفع خلال الأيام القليلة الماضية.
- يُقصد من الارتباط السلبي أن متغير الناتج يتجه عكس النتائج السابقة. على سبيل المثال، يلاحظ نظام التراجع التلقائي أن الأيام القليلة الماضية كانت تمطر ولكنه يتنبأ بيوم مشمس غدًا.
- قد يشير الارتباط الصفري إلى عدم وجود أنماط محددة بين المدخلات والنواتج.
يستخدم مهندسو البيانات الارتباط التلقائي لتحديد عدد الخطوات التي يجب تضمينها في النموذج لتحسين موارد الحوسبة ودقة الاستجابة. في بعض التطبيقات، قد يُظهر نموذج التراجع التلقائي ارتباطًا تلقائيًا قويًا عند استخدام متغيرات من الماضي القريب ولكنه قد يُظهر ارتباطًا تلقائيًا أضعف للمدخلات البعيدة. على سبيل المثال، وجد المهندسون أن أداة التنبؤ بالطقس المستندة إلى التراجع التلقائي أقل حساسية للتنبؤات السابقة التي ترجع إلى فترة تزيد على 30 يومًا. لذلك، راجعوا النموذج ليشمل النتائج المتأخرة من الثلاثين يومًا الماضية فقط. وأدى ذلك إلى نتائج أكثر دقة باستخدام موارد حوسبة أقل.
ما الفرق بين التراجع التلقائي والأنواع الأخرى من أساليب التحليل التراجعي؟
بصرف النظر عن التراجع التلقائي، قُدم العديد من تقنيات التراجع لتحليل المتغيرات والترابطات بينها. تصف الأقسام التالية الاختلافات.
التراجع الخطي مقابل التراجع التلقائي
تفترض كلتا طريقتي التراجع أن المتغيرات السابقة تشترك في علاقة خطية مع القيم المستقبلية. ويتنبأ التراجع الخطي بنتيجة تستند إلى عدة متغيرات مستقلة في الإطار الزمني نفسه. وفي الوقت ذاته، يستخدم التراجع التلقائي نوعًا واحدًا فقط من المتغيرات ولكنه يوسعه عبر عدة نقاط للتنبؤ بالنتيجة المستقبلية. على سبيل المثال، يمكنك استخدام التراجع الخطي للتنبؤ بوقت تنقلك استنادًا إلى الطقس ومستوى ازدحام حركة المرور وسرعة المشي. في المقابل، يستخدم نموذج التراجع التلقائي أوقات تنقلك السابقة لتقدير وقت الوصول لهذا اليوم.
التراجع متعدد الحدود مقارنةً بالتراجع التلقائي
يُعد التراجع متعدد الحدود طريقة إحصائية لتمثيل علاقة المتغيرات غير الخطية. لا يمكن تمثيل بعض المتغيرات خطيًا باستخدام خط مستقيم، بل إنها تتطلب حدودًا متعددة إضافية لتعكس علاقاتها بشكل أفضل. على سبيل المثال، يستخدم المهندسون التراجع متعدد الحدود لتحليل دخل الموظفين بناءً على مستوى تعليمهم. من ناحية أخرى، يُعد التراجع التلقائي مناسبًا للتنبؤ بالدخل المستقبلي للموظف بناءً على رواتبه السابقة.
التراجع اللوجستي مقارنةً بالتراجع التلقائي
يسمح التراجع اللوجستي للنموذج الإحصائي بالتنبؤ باحتمالية وقوع حدث معين في الحد الاحتمالي. وهو يعبر عن نتيجة التنبؤ بالنسبة المئوية بدلاً من نطاق معين من الأرقام. على سبيل المثال، يستخدم محللو الأعمال نموذج التراجع اللوجستي للتنبؤ بفرصة نسبتها 85% لزيادة تكلفة التوريد في الشهر التالي. على العكس من ذلك، يتنبأ نموذج التراجع التلقائي بسعر المخزون المحتمل بالنظر إلى تنبؤاته التاريخية للأشهر السابقة.
تراجع الحرف مقارنةً بالتراجع التلقائي
تراجع الحرف هو أحد أشكال التراجع الخطي الذي يسمح بتقييد معامل النموذج. يمكن لعلماء البيانات ضبط عامل جزائي للتعويض عن تأثير المعامل في نمذجة النتيجة. ويمكن اختزال معامل المعلمة إلى ما يقرب الصفر في نموذج تراجع الحرف. ويكون هذا مفيدًا عندما تكون الخوارزمية التراجعية عرضة للإفراط في التدريب. يُعد الإفراط في التدريب حالة يستطيع النموذج فيها إجراء التعميم بصورة جيدة مع بيانات التدريب ولكن ليس مع بيانات العالم الحقيقي غير المألوفة له. وفي الوقت نفسه، لا يحتوي نموذج التراجع التلقائي على آلية المعامل الجزائي.
تراجع لاسو مقارنةً بالتراجع التلقائي
يشبه تراجع لاسو تراجع الحرف، الذي يمكن أن يقيد المعامل المتغير بعامل جزائي. ومع ذلك، يمكن أن يؤدي تراجع لاسو إلى اختزال المعامل إلى الصفر. يسمح هذا لعلماء البيانات بتبسيط النماذج المعقدة من خلال تجاهل المعلمات غير المؤثرة بشكل كبير. وفي الوقت نفسه، لا تنظم نماذج التراجع التلقائي تنبؤاتها باستخدام معامل الانكماش.
كيف يمكن لـ AWS المساعدة في نماذج التراجع التلقائي؟
باستخدام Amazon Web Services (AWS)، يمكن لفرق البرامج إنشاء نماذج التراجع التلقائي لتطبيقات الذكاء الاصطناعي المولّد وتدريبها ونشرها وتوسيع نطاقها بشكل أكثر كفاءة. وبفضل الأمان من الفئة المخصصة للمؤسسات والبنية التحتية المُدارة، تعمل AWS على تبسيط عملية تطوير النماذج التوليدية للشركات وتقليل الوقت اللازم للظهور في السوق. على سبيل المثال، يُمكنك استخدام:
- Amazon Bedrock، وهي خدمة مُدارة توفر نماذج تأسيس يمكنك استخدامها للتخصيص والابتكار باستخدام بياناتك الخاصة.
- Amazon SageMaker لإنشاء نماذج تعلّم الآلة لأي حالة استخدام وتدريبها ونشرها
- AWS Trainium وAWS Inferentia لتدريب تطبيقات الذكاء الاصطناعي المولّد واستضافتها وتوسيع نطاقها على السحابة باستخدام قوة حوسبة عالية الأداء ومنخفضة التكلفة.
ابدأ استخدام نماذج التراجع التلقائي على AWS عن طريق إنشاء حساب اليوم.