Amazon SageMaker HyperPod

توسيع نطاق تطوير نماذج الذكاء الاصطناعي المولّد وتسريعها عبر الآلاف من مسرعات الذكاء الاصطناعي

ما سبب أهمية SageMaker HyperPod؟

يزيل Amazon SageMaker HyperPod الأحمال الثقيلة غير المتمايزة التي ينطوي عليها بناء نماذج الذكاء الاصطناعي المولّد. فهو يساعد على توسيع نطاق مهام تطوير النماذج بسرعة مثل التدريب أو الضبط الدقيق أو الاستدلال عبر مجموعة من مئات أو آلاف مسرعات الذكاء الاصطناعي. يتيح SageMaker HyperPod الإدارة المركزية عبر جميع مهام تطوير النماذج، مما يمنحك الرؤية الكاملة والتحكم في كيفية تحديد أولويات المهام المختلفة، وكيفية تخصيص موارد الحوسبة لكل مهمة، مما يساعدك على زيادة استخدام وحدة معالجة الرسوميات (GPU) وAWS Trainium لمجموعتك وتسريع الابتكار.

مصمم خصيصًا لدعم عمليات التدريب الموزع واسعة النطاق

مع SageMaker HyperPod، يمكنك توزيع وموازنة عبء العمل التدريبي بكفاءة عبر جميع المسرعات. يقوم SageMaker HyperPod تلقائيًا بتطبيق أفضل تكوينات التدريب للنماذج الشائعة المتاحة للجمهور، لمساعدتك على تحقيق الأداء الأمثل بسرعة. كما أنه يراقب مجموعتك باستمرار بحثًا عن أي أخطاء في البنية التحتية، ويصلح المشكلة تلقائيًا، ويستعيد أعباء العمل دون تدخل بشري - كل ذلك يساعد على توفير ما يصل إلى 40% من وقت التدريب.

فوائد SageMaker HyperPod

يوفر ابتكار إدارة المهام SageMaker HyperPod الرؤية الكاملة والتحكم في تخصيص موارد الحوسبة عبر مهام تطوير نموذج الذكاء الاصطناعي المولّد، مثل التدريب والاستدلال. يقوم SageMaker HyperPod تلقائيًا بإدارة قوائم انتظار المهام، مما يضمن ترتيب أولويات المهام الأكثر أهمية وإكمالها في الوقت المحدد وفي حدود الميزانية، مع استخدام موارد الحوسبة بكفاءة أكبر لتقليل تكاليف تطوير النموذج بنسبة تصل إلى 40%.
باستخدام وصفات SageMaker HyperPod، يستفيد علماء البيانات والمطورون من جميع مجموعات المهارات من الأداء المتطور أثناء البدء في التدريب وضبط نماذج الذكاء الاصطناعي المولّد المتاحة للجمهور في دقائق. يمكنك أيضًا تخصيص نماذج التأسيس الخاصة بـ Amazon Nova، والتي تشمل Nova Micro وNova Lite وNova Pro، لحالات الاستخدام الخاصة بالأعمال من خلال وصفات جاهزة تساعد على تعزيز دقة تطبيقات الذكاء الاصطناعي المُولِّد، مع الحفاظ على الكفاءة السعرية والأداء منخفض الكمون. يوفر SageMaker HyperPod أيضًا أدوات مدمجة للتجربة والمراقبة لمساعدتك على تحسين أداء النموذج.
يسمح لك SageMaker HyperPod بتقسيم النماذج ومجموعات بيانات التدريب تلقائيًا عبر مثيلات مجموعة AWS لمساعدتك على توسيع نطاق أعباء العمل التدريبية بكفاءة. إنها تساعدك على تحسين وظيفتك التدريبية للبنية التحتية لشبكة AWS وطوبولوجيا المجموعة. كما أنه يبسط نقاط التفتيش النموذجية عبر الوصفات من خلال تحسين وتيرة حفظ نقاط التفتيش، وضمان الحد الأدنى من النفقات العامة أثناء التدريب.
يوفر SageMaker HyperPod بيئة مرنة لتطوير النماذج من خلال اكتشاف أخطاء البنية التحتية وتشخيصها والتعافي منها تلقائيًا، مما يسمح لك بتشغيل أعباء عمل تطوير النماذج باستمرار لعدة أشهر دون انقطاع.
تعمل SageMaker HyperPod على تسريع نشر النماذج مفتوحة الأوزان القادمة من SageMaker JumpStart وكذلك النماذج المعدلة والمخزنة في S3 وFSx. يمكنك تبسيط مهام نشر النماذج عبر التوفير التلقائي للموارد، وإدارة موارد الحوسبة باستخدام حوكمة المهام، ومتابعة الأداء بشكل لحظي، وتعزيز إمكانيات المراقبة والتتبع.

تقديم إدارة المهام في SageMaker HyperPod

حقق أقصى استفادة واكتسب رؤية كاملة لموارد الحوسبة، كل ذلك مع تقليل التكاليف.

تعرّف على المزيد