Amazon EC2

مثيلات Amazon EC2 P5

مثيلات عالية الأداء مستندة إلى وحدة معالجة الرسومات (GPU) للتعليم العميق وتطبيقات الحوسبة عالية الأداء (HPC)

ما سبب أهمية مثيلات Amazon EC2 P5؟

مثيلات P5 المستندة إلى Amazon Elastic Compute Cloud‏ (Amazon EC2)، والمدعومة بوحدات NVIDIA H100 Tensor Core GPUs، ومثيلات P5e وP5en المدعومة من وحدات NVIDIA H200 Tensor Core GPUs توفر أعلى أداء في Amazon EC2 لتطبيقات التعليم العميق (DL) وتطبيقات الحوسبة عالية الأداء (HPC). فهي تساعدك على تسريع وقت الوصول إلى الحل بنسبة تصل إلى 4 أضعاف مقارنة بمثيلات EC2 من الجيل السابق المستندة إلى وحدة معالجة الرسومات (GPU)، وتقليل تكلفة تدريب نماذج تعلّم الآلة (ML) بنسبة تصل إلى 40%. تساعدك هذه المثيلات على تكرار الحلول بوتيرة أسرع والوصول إلى السوق بسرعة أكبر. يمكنك استخدام مثيلات P5 وP5e وP5en للتدريب ونشر النماذج اللغوية الكبيرة المعقدة (LLMs) ونماذج النشر التي تعمل على تشغيل تطبيقات الذكاء الاصطناعي المُولِّد. وتشمل هذه التطبيقات الإجابة عن الأسئلة، وتوليد التعليمات البرمجية، وتوليد الفيديو والصور، والتعرف على الكلام. يمكنك أيضًا استخدام هذه المثيلات لنشر تطبيقات الحوسبة عالية الأداء (HPC) على نطاق واسع لاكتشاف المستحضرات الدوائية والتحليل الزلزالي والتنبؤ بالطقس والنمذجة المالية.

ولتحقيق هذه التحسينات في الأداء والتوفير في التكاليف، تُكمّل مثيلات P5 وP5e وحدات معالجة الرسومات من نوع NVIDIA P5e Tensor Core بأداء وحدة NVIDIA H100 and H200 Tensor Core GPUs الأعلى بمقدار الضعف مقارنة بوحدات المعالجة المركزية (CPU)، وذاكرة النظام الأعلى بمقدار الضعف، ومساحة التخزين المحلية الأعلى بمقدار أربعة أضعاف مقارنة بالمثيلات المستندة إلى وحدة معالجة الرسومات من الجيل السابق. تقوم مثيلات P5en بإقران وحدات معالجة الرسومات NVIDIA H200 Tensor Core GPUs مع وحدة المعالجة المركزية Intel Sapphire Rapids CPU عالية الأداء، مما يتيح Gen5 PCIe بين وحدة المعالجة المركزية (CPU) ووحدة معالجة الرسومات (GPU). توفر مثيلات P5en ما يصل إلى 4 أضعاف عرض النطاق الترددي بين وحدة المعالجة المركزية (CPU) ووحدة معالجة الرسومات (GPU) وزمن انتقال أقل للشبكة مقارنة بمثيلات P5e وP5 وبالتالي تحسين أداء التدريب الموزع. يوفر دعم مثيلات P5 وP5e ما يصل إلى 3200 جيجابت في الثانية من الشبكات باستخدام الجيل الثاني من Elastic Fabric Adapter‏ (EFA). يُظهر P5en، مع الجيل الثالث من EFA باستخدام Nitro v5، تحسنًا يصل إلى 35% في وقت الاستجابة مقارنة بـ P5 الذي يستخدم الجيل السابق من EFA وNitro. يساعد ذلك على تحسين أداء الاتصالات الجماعية لأعباء العمل التدريبية الموزعة مثل التعليم العميق والذكاء الاصطناعي المولّد ومعالجة البيانات في الوقت الفعلي وتطبيقات الحوسبة عالية الأداء (HPC). لتوفير حوسبة واسعة النطاق في زمن انتقال منخفض، يتم نشر هذه المثيلات في Amazon EC2 UltraClusters التي تتيح توسيع نطاق ما يصل إلى 20000 وحدة معالجة رسومات H100 أو H200 متصلة بشبكة غير قابلة للحظر بحجم بيتابت. يمكن لمثيلات P5 وP5e وP5en في مجموعات P5en UltraClusters تقديم ما يصل إلى 20 إكسافلوب من قدرة الحوسبة الإجمالية - وهو أداء يعادل أداء الكمبيوتر العملاق.

مثيلات Amazon EC2 P5

الفوائد

يمكن لمثيلات P5 وP5e وP5en تدريب نماذج الذكاء الاصطناعي المولّد على نطاق واسع وتقديم ما يصل إلى 4 أضعاف أداء مثيلات EC2 من الجيل السابق القائمة على وحدة معالجة الرسومات (GPU).

تقلل مثيلات P5 وP5e وP5en من أوقات التدريب ووقت الحل من أسابيع إلى بضعة أيام فقط. يساعدك هذا على التكرار بوتيرة أسرع والوصول إلى السوق بسرعة أكبر.

توفر مثيلات P5 وP5e وP5en ما يصل إلى 40% من تكاليف التدريب على التعليم العميق (DL) والبنية التحتية للحوسبة عالية الأداء (HPC) مقارنةً بمثيلات EC2 من الجيل السابق المستندة إلى وحدة معالجة الرسومات (GPU).

توفر مثيلات P5 وP5e وP5en ما يصل إلى 3200 جيجابت في الثانية من شبكات EFA. تُنشَر هذه المثيلات في EC2 UltraClusters وتوفر 20 إكسافلوب من إمكانات الحوسبة الإجمالية.

الميزات

توفر مثيلات P5 ما يصل إلى 8 وحدات من وحدات معالجة الرسومات من نوع NVIDIA H100 بإجمالي ذاكرة HBM3 GPU تصل إلى 640 جيجابايت لكل مثيل. توفر مثيلات P5e وP5en ما يصل إلى 8 وحدات NVIDIA P5en GPUs بإجمالي ذاكرة GPU H200 تصل إلى 1128 وحدة HBM3e GPU لكل مثيل. تدعم كلا توعي المثيلات ما يصل إلى 900 جيجابت/ثانية من التوصيل البيني لوحدة معالجة الرسومات NVSwitch GPU (يبلغ إجمالي عرض النطاق ثنائي الأقسام 3.6 تيرابايت/ثانية في كل مثيل)، بحيث يمكن لكل وحدة من وحدات معالجة الرسومات (GPU) الاتصال بكل وحدة معالجة رسومات أخرى في المثيل نفسه بزمن استجابة أحادي الخطوة.

تحتوي وحدات معالجة الرسومات NVIDIA H100 وH200 على محرك محول يدير بذكاء ويختار ديناميكيًا بين حسابات FP8 و16 بت. تساعد هذه الميزة على تقديم عمليات تسريع فائقة للتدريب على التعليم العميق على نماذج اللغة الكبيرة (LLMs) مقارنة بوحدات معالجة الرسومات من نوع A100 من الجيل السابق. بالنسبة لأحمال عمل الحوسبة عالية الأداء (HPC)، تحتوي وحدات معالجة الرسومات NVIDIA H100 وH200 على تعليمات DPX جديدة تزيد من تسريع خوارزميات البرمجة الديناميكية مقارنة بوحدات معالجة الرسومات A100.

تقدم مثيلات P5 وP5e وP5en ما يصل إلى 3200 جيجابت في الثانية من شبكات EFA. تقترن EFA أيضًا بـ NVIDIA GPUDirect RDMA لتمكين اتصال وحدة معالجة رسومات إلى وحدة معالجة رسومات أخرى (GPU-to-GPU) بزمن استجابة منخفض بين الخوادم مع وجود تجاوز في نظام التشغيل.

مثيلات P5 وP5e وP5en تدعم أنظمة ملفات Amazon FSx for Lustre حتى تتمكن من الوصول إلى البيانات التي تتميز بمعدل نقل يبلغ المئات من الجيجابايت/في الثانية وبملايين من عمليات الإدخال/الإخراج في الثانية (IOPS) المطلوبة لتلبية أعباء عمل التعليم العميق والحوسبة عالية الأداء واسعة النطاق. يدعم كل مثيل أيضًا ما يصل إلى 30 تيرابايت من مساحة تخزين NVMe SSD المحلية للوصول السريع إلى مجموعات البيانات الكبيرة. يمكنك أيضًا استخدام مساحة تخزين افتراضية غير محدودة وفعالة من حيث التكلفة باستخدام خدمة التخزين البسيطة في Amazon‏ (Amazon S3).

شهادات العملاء

في ما يلي بعض الأمثلة عن كيفية تحقيق العملاء والشركاء لأهداف أعمالهم باستخدام مثيلات Amazon EC2 P4.

Anthropic

في Anthropic، نعمل على بناء أنظمة ذكاء اصطناعي موثوقة وقابلة للتفسير والتوجيه. على الرغم من تميز أنظمة الذكاء الاصطناعي العامة الكبيرة اليوم بفوائد كبيرة، فإنها يمكن أيضًا أن تكون غير متوقعة وغير موثوقة ومبهمة. هدفنا هو إحراز تقدم في هذه المشكلات ونشر الأنظمة التي يجدها الناس مفيدة. منظمتنا هي واحدة من المنظمات القليلة في العالم التي تبني نماذج تأسيسية في أبحاث التعليم العميق. هذه النماذج معقدة للغاية، ولتطوير هذه النماذج المتطورة والتدريب عليها، نحتاج إلى توزيعها بكفاءة عبر مجموعات كبيرة من وحدات معالجة الرسومات. نحن نستخدم مثيلات Amazon EC2 P4 على نطاق واسع اليوم، كما أننا متحمسون لإطلاق مثيلات P5. حيث نتوقع أنها ستقدم فوائد كبيرة فيما يخص السعر والأداء مقارنة بمثيلات P4d، وأنها ستكون متاحة على النطاق الضخم المطلوب لبناء الجيل التالي من نماذج اللغات الكبيرة والمنتجات ذات الصلة.

Tom Brown, Cofounder, Anthropic

AON

في AON، كنا نُحدث ثورة في الطريقة التي تتعامل بها شركات التأمين مع التحديات الحسابية المعقدة. نظرًا لتعقيد المخاطر المالية والضمانات، تحتاج التوقعات الإكتوارية إلى عمليات محاكاة موسعة، غير أن الأنظمة القديمة غير المترابطة والعمليات اليدوية المليئة بالأخطاء تقف عائقًا أمام التحليل الدقيق والمفصل. كانت مثيلات Amazon EC2 P5 نقطة تحوّل بالنسبة لنا. أصبح بإمكاننا حاليًا تنفيذ نماذج تعلّم الآلة والتوقعات الاقتصادية التي كانت تحتاج إلى أيام، في غضون ساعات قليلة. القدرة على استخدام مثيل GPU واحد من نوع H100 ‏(p5.4xlarge) تعني أننا لا نوفر الوقت فحسب، بل نحسّن أيضًا من استخدام مواردنا الحسابية. عملاؤنا يتمتعون الآن بفهم غير مسبوق لإدارة المخاطر وتسعير المنتجات، بفضل هذه التكنولوجيا المتقدمة.

Van Beach, Global Head of Life Solutions, AON

Cohere

تتولى Cohere المسؤولية في مساعدة كل شركة على تسخير قوة الذكاء الاصطناعي اللغوي لاستكشاف المعلومات وتوليدها والبحث عنها والتعامل معها بطريقة طبيعية وبسيطة، ونشرها عبر منصات سحابية متعددة في بيئة البيانات التي تناسب كل عميل بشكل أفضل. ستطلق مثيلات Amazon EC2 P5 التي تعمل بوحدة NVIDIA H100 العنان لقدرة الشركات على الإنشاء والنمو والتوسع بشكل أسرع من خلال قوتها الحاسوبية إلى جانب إمكانات LLM الحديثة وقدرات الذكاء الاصطناعي المولّد من Cohere.

Aidan Gomez, CEO, Cohere

Hugging Face

بصفتنا مجتمع المصادر المفتوحة الأسرع نموًا للتعلّم الآلي، نقدم الآن أكثر من 150,000 نموذج مُدرَّب سابقًا و25000 مجموعة بيانات على منصتنا لمعالجة اللغة الطبيعية والرؤية الحاسوبية وعلم الأحياء والتعليم بواسطة التعزيز والمزيد. ومع التقدم الكبير في نماذج اللغة الكبيرة والذكاء الاصطناعي المولّد، فإننا نعمل مع AWS لبناء نماذج مستقبلية مفتوحة المصدر والإسهام بها. نحن نتطلع إلى استخدام مثيلات Amazon EC2 P5 عبر Amazon SageMaker على نطاق واسع في UltraClusters مع EFA لتسريع عملية توفير نماذج الذكاء الاصطناعي الأساسية الجديدة للجميع.

Julien Chaumond, CTO and Cofounder, Hugging Face

تفاصيل المنتج

Instance Size	vCPUs	Instance Memory	GPU	GPU memory	Network Bandwidth (Gbps)	GPUDirect RDMA	GPU Peer to Peer	Instance Storage (TB)	EBS Bandwidth (Gbps)
p5.4xlarge	16	256 جيبي بايت (GiB)	1 H100	80 جيجابايت HBM3	EFA بسرعة 100 جيجابت في الثانية	لا*	غير قابل للتطبيق*	3.84 NVMe SSD	10
p5.48xlarge	192	2 تيبي بايت	8 H100	640 جيجابايت HBM3	EFA بسرعة 3200 جيجابت في الثانية	نعم	NVSwitch بسرعة 900 جيجابايت في الثانية	8 x 3.84 NVMe SSD	80
p5e.48xlarge	192	2 تيبي بايت	8 H200	1128 جيجابايت HBM3e	EFA بسرعة 3200 جيجابت في الثانية	نعم	NVSwitch بسرعة 900 جيجابايت في الثانية	8 x 3.84 NVMe SSD	80
p5en.48xlarge	192	2 تيبي بايت	8 H200	1128 GB HBM3e	EFA بسرعة 3200 جيجابت في الثانية	نعم	NVSwitch بسرعة 900 جيجابايت في الثانية	8 x‏ 3.84 NVMe SSD	100

*GPUDirect RDMA غير مدعوم في P5.4xlarge

بدء حالات استخدام تعلم الآلة (ML)

SageMaker هو خدمة مُدارة بالكامل لبناء نماذج التعلم الآلي وتدريبها وتوزيعها. باستخدام SageMaker HyperPod، يمكنك بسهولة التوسع إلى عشرات أو مئات أو آلاف وحدات معالجة الرسومات (GPUs) لتدريب نموذج بسرعة على أي نطاق دون القلق بشأن إعداد مجموعات التدريب المرنة وإدارتها.

DLAMI توفر لممارسي تعلم الآلة والباحثين البنية التحتية والأدوات لتسريع التعليم العميق في السحابة، على أي نطاق. حاويات التعلم العميق هي صور Docker مثبتة سابقًا باستخدام أُطر عمل التعليم العميق لتبسيط نشر بيئات التعلم الآلي المخصصة من خلال السماح لك بتخطي العملية المعقدة لبناء بيئاتك وتحسينها من البداية.

إذا كنت تفضل إدارة أعباء العمل المعتمدة على الحاويات من خلال خدمات تكوين الحاويات وتنسيقها وإدارتها المؤتمتة، فيمكنك نشر مثيلات P5 وP5e وP5en باستخدام Amazon EKS أو Amazon ECS.

بدء حالات استخدام الحوسبة عالية الأداء (HPC)

مثيلات P5 وP5e وP5en هي منصة مثالية لتشغيل عمليات المحاكاة الهندسية والمالية الحوسبية والتحليل الزلزالي ووضع النماذج الجزيئية والعلوم الوراثية والعرض وغيرها من أعباء عمل الحوسبة عالية الأداء المستندة إلى وحدات معالجة الرسومات. في أغلب الأحيان تتطلب تطبيقات الحوسبة عالية الأداء أداءً شبكيًا عاليًا وتخزينًا سريعًا وكميات كبيرة من الذاكرة وإمكانات حوسبة عالية أو تتطلبها كلها معًا. الأنواع الثلاثة تدعم شبكة EFA التي تمكّن تطبيقات الحوسبة عالية الأداء (HPC) باستخدام واجهة تمرير الرسائل (MPI) للتوسع إلى الآلاف من وحدات معالجة الرسومات (GPUs). تساعد AWS Batch وAWS ParallelCluster مطوري الحوسبة عالية الأداء على إنشاء تطبيقات الحوسبة عالية الأداء الموزعة وتوسيع نطاقها بسرعة.

تعرّف على المزيد

بدء استخدام AWS

الخطوة 1 - اشترك للحصول على حساب AWS

الوصول على الفور إلى الطبقة المجانية من AWS.

تعرّف على المزيد

الخطوة 2 - تعلم مع برامج تعليمية مدتها 10 دقائق

استكشف وتعلَّم من خلال برامج تعليمية بسيطة.

تعرّف على المزيد

الخطوة 3 - ابدأ البناء مع AWS

ابدأ في الإنشاء باستخدام أدلة مُفصَّلة خطوة بخطوة لمساعدتك في إطلاق مشروع AWS الخاص بك.

تعرّف على المزيد

مثيلات Amazon EC2 P5

ما سبب أهمية مثيلات Amazon EC2 P5؟

مثيلات Amazon EC2 P5

الفوائد

الميزات

شهادات العملاء

Anthropic

AON

Cohere

Hugging Face

تفاصيل المنتج

بدء حالات استخدام تعلم الآلة (ML)

بدء حالات استخدام الحوسبة عالية الأداء (HPC)

بدء استخدام AWS

الخطوة 1 - اشترك للحصول على حساب AWS

الخطوة 2 - تعلم مع برامج تعليمية مدتها 10 دقائق

الخطوة 3 - ابدأ البناء مع AWS

التعلُّم

الموارد

المطورين

المساعدة

مثيلات Amazon EC2 P5

ما سبب أهمية مثيلات Amazon EC2 P5؟

مثيلات Amazon EC2 P5

الفوائد

تدريب النماذج التي تزيد عن 100 مليار (100B+) معلمة على نطاق واسع

تقليل الوقت المستغرق في الحل والتكرار بشكل أسرع

خفض تكاليف البنية التحتية للتعليم العميق والحوسبة عالية الأداء

شغِّل التدريب الموزع الحوسبة عالية الأداء باستخدام حوسبة exascale

الميزات

NVIDIA H100 وH200 Tensor Core GPUs

تعليمات محرك المحوِّل وDPX الجديدة

شبكات عالية الأداء

وحدة التخزين عالية الأداء

شهادات العملاء

Anthropic

AON

Cohere

Hugging Face

تفاصيل المنتج

بدء حالات استخدام تعلم الآلة (ML)

استخدم SageMaker

استخدم DLAMI أو حاويات التعليم العميق

استخدم Amazon EKS أو Amazon ECS

بدء حالات استخدام الحوسبة عالية الأداء (HPC)

بدء استخدام AWS

الخطوة 1 - اشترك للحصول على حساب AWS

الخطوة 2 - تعلم مع برامج تعليمية مدتها 10 دقائق

الخطوة 3 - ابدأ البناء مع AWS

التعلُّم

الموارد

المطورين

المساعدة