ما المقصود بهندسة الميزات؟
ميزات النموذج هي المدخلات التي تستخدمها نماذج تعلم الآلة (ML) أثناء التدريب والاستدلال لوضع التنبؤات. وتعتمد دقة نموذج تعلم الآلة على مجموعة دقيقة ومحددة من الميزات. على سبيل المثال، في حالة تطبيق يستند إلى تعلم آلة للتوصية بقائمة تشغيل موسيقى، يمكن أن تتضمن الميزات تقييمات الأغاني، والأغاني التي سبق الاستماع إليها، ومدة الاستماع إلى الأغنية. قد يتطلب إنشاء الميزات جهودًا هندسية كبيرة. تنطوي عملية هندسة الميزات على استخراج المتغيرات من البيانات الأولية وتحويلها، مثل قوائم الأسعار، وأوصاف المنتجات، وأحجام المبيعات التي يمكنك استخدامها في التدريب والتنبؤ. وتشمل الخطوات المطلوبة في هندسة الميزات استخراج البيانات وتنقيحها ثم إنشاء الميزات وتخزينها.
ما هي التحديات التي تواجهها هندسة الميزات؟
تعد هندسة الميزات تحديًا لأنها تتطلّب مزيجًا من تحليل البيانات والمعرفة في مجال الأعمال وبعض الحدس. عند إنشاء الميزات، من المغري اللجوء فورًا إلى البيانات المتاحة، ولكن غالبًا ما يجب البدء بالتفكير في البيانات المطلوبة من خلال التحدث مع الخبراء، والعصف الذهني وطرح الأفكار، وإجراء أبحاث حول الأطراف الثالثة. في حال عدم المرور بهذه المراحل، قد تفوتك متغيرات توقّع مهمة.
استخراج البيانات
إنشاء الميزات
تخزين الميزات
كيف يمكنك استخدام AWS لهندسة الميزات؟
باستخدام Amazon SageMaker Data Wrangler، يمكنك تبسيط عملية هندسة الميزات باستخدام واجهة مرئية واحدة. فتسمح لك أداة تحديد البيانات في SageMaker Data Wrangler باختيار البيانات الأولية التي تريدها من مصادر البيانات المختلفة واستيرادها بنقرة واحدة. يتضمن SageMaker Data Wrangler أكثر من 300 عملية تحويل بيانات مضمنة، ما يتيح لك إعداد الميزات في وضعها الطبيعي وتحويلها ودمجها بدون الحاجة إلى كتابة أي تعليمات برمجية. بعد تجهيز بياناتك، يمكنك إنشاء مهام سير عمل تعلّم الآلة مؤتمتة بالكامل باستخدام Amazon SageMaker Pipelines وحفظها في Amazon SageMaker Feature Store بهدف إعادة استخدامها. SageMaker Feature Store عبارة عن مستودع مبني لغرض معين يمكنك تخزين الميزات فيه والوصول إليها، لذلك يسهل عليك تسميتها وتنظيمها وإعادة استخدامها في الفرق المتعددة. يوفر SageMaker Feature Store متجرًا موحدًا للميزات أثناء التدريب والاستدلال في الوقت الفعلي بدون الحاجة إلى كتابة تعليمات برمجية إضافية أو إنشاء عمليات يدوية للحفاظ على الاتساق بين الميزات.