دعم Amazon EKS في Amazon SageMaker HyperPod لتحجيم تطوير نموذج الأساس

:تاريخ النشر 10 سبتمبر 2024

يسعدنا أن نعلن عن التوافر العام لدعم Amazon EKS في SageMaker HyperPod الذي يُمكّن العملاء من تشغيل أعباء عمل Kubernetes لديهم وإداراتها على SageMaker HyperPod، وهي بنية تحتية مصممة خصيصًا لتطوير نموذج التأسيس (FM) مما يقلل الوقت اللازم لتدريب النماذج بنسبة تصل إلى 40%.

يستخدم العديد من العملاء Kubernetes لتنسيق مهام سير عمل تعلّم الآلة لديهم نظرًا لقابليته للنقل، والتوسع، ونظامه البيئي الغني بالأدوات. يرغب هؤلاء العملاء في الاستمرار في استخدام واجهة Kubernetes المألوفة، لكنهم ما زالوا يريدون طريقة تلقائية لإدارة أعطال الأجهزة. يجمع دعم EKS في HyperPod بين فوائد SageMaker HyperPod التي تقدم كتل عالية الأداء ذاتية المعالجة مع إمكانات الوضع في حاوية التي توفرها Amazon EKS، وهي خدمة Kubernetes مُدارة. مع هذا الإطلاق، يمكن للعملاء إجراء التحقق العميق من الحالة الصحية أثناء إنشاء الكتلة لتقليل حالات الفشل أثناء التدريب. علاوة على ذلك، تستبدل HyperPod تلقائيًا العُقد المعيبة وتستأنف التدريب من آخر نقطة تحقق لك على كل من AWS Trainium وNvidia GPU على نطاق يزيد عن ألف مسرّع. يتمتع العملاء بالمرونة في استخدام HyperPod CLI الجديد أو أدواتهم المفضلة لإرسال أعباء العمل وإدارتها ومراقبتها. توفر بيئة الكتلة الدائمة إمكانية وصول ssm والقدرة على تخصيص الكتلة. تتكامل كتل HyperPod المنظمة من EKS أيضًا مع رؤى حاوية CloudWatch لتوفير إمكانية الملاحظة الجاهزة، من خلال الاكتشاف التلقائي للحالة الصحية لعقدة HyperPod وتصورها في لوحات المعلومات المنظمة.

يتوفر هذا الإصدار بشكل عام في مناطق AWS حيث يتوفر SageMaker HyperPod باستثناء أوروبا (لندن).

لمعرفة المزيد، اطلع على قائمة الموارد التالية: صفحة الويب، مدونة أخبار AWS، الوثائق، مستودع Github.