تعلن شركة Amazon SageMaker AI عن توفر مثيلات P5e وG6e للاستدلال
يسعدنا أن نعلن عن التوفر العام لمثيلات G6e المحسّنة للاستدلال (مدعمة بوحدات معالجة الرسومات NVIDIA L40S Tensor Core) وP5e (مدعمة بوحدات معالجة الرسومات NVIDIA H200 Tensor Core) على Amazon SageMaker.
بفضل ذاكرة وحدة معالجة الرسوميات ذات نطاق الشبكة العالي الذي يبلغ 1128 جيجابايت عبر 8 وحدات معالجة رسوميات NVIDIA H200، و30 تيرابايت من وحدة تخزين SSD NVMe المحلية، و192 وحدة معالجة مركزية افتراضية، و2 تيرابايت من ذاكرة النظام، يمكن لمثيلات ml.p5e.48xlarge تقديم أداء استثنائي لأعباء عمل الاستدلال بالذكاء الاصطناعي التي تتطلب حوسبة مكثفة مثل نموذج اللغة الكبير مع أكثر من 100 مليار معلمة، ونماذج الأساس متعددة الوسائط الإعلامية، وتوليد البيانات الاصطناعية، وتطبيقات الذكاء الاصطناعي المولّد المعقدة بما في ذلك الإجابة على الأسئلة، وتوليد التعليمات البرمجية، وتوليد الفيديو والصور.
بفضل 8 وحدات معالجة رسومية NVIDIA L40s Tensor Core مع 48 جيجابايت من الذاكرة لكل وحدة معالجة رسومية ومعالجات AMD EPYC من الجيل الثالث، يمكن لمثيلات ml.g6e تقديم أداء أفضل بما يصل إلى 2.5 مرة مقارنة بمثيلات ml.g5. يمكن للعملاء استخدام مثيلات ml.g6e لتشغيل الاستدلال بالذكاء الاصطناعي لنماذج اللغة الكبيرة (LLM) مع ما يصل إلى 13 مليار معلمة ونماذج الانتشار لتوليد الصور والفيديو والصوت.
أصبحت الآن مثيلات ml.p5e وml.g6e متوفرة للاستخدام على SageMaker في شرق الولايات المتحدة (أوهايو) وغرب الولايات المتحدة (أوريجون). للبدء، ما عليك سوى طلب زيادة الحد من خلال AWS Service Quotas. للحصول على معلومات التسعير الخاصة بهذه المثيلات، يُرجى زيارة صفحة التسعير الخاصة بنا. لمزيد من المعلومات حول نشر النماذج باستخدام SageMaker، راجع النظرة العامة هنا والوثائق هنا. لمعرفة المزيد حول هذه المثيلات بشكل عام، يُرجى زيارة صفحات منتجات P5e وG6e.