Amazon-EC2-P5en-Instances, optimiert für generative KI und HPC, sind allgemein verfügbar
Heute kündigte AWS die allgemeine Verfügbarkeit von Amazon EC2-P5en-Instances (Amazon Elastic Compute Cloud) an, die von den neuesten NVIDIA H200 Tensor Core-GPUs betrieben werden. Diese Instances bieten die höchste Leistung in Amazon EC2 für Deep Learning- und High Performance Computing (HPC)-Anwendungen.
Sie können Amazon-EC2-P5en-Instances für das Training und die Bereitstellung zunehmend komplexerer großer Sprachmodelle (LLMs) und Diffusionsmodelle verwenden, die die anspruchsvollsten generativen KI-Anwendungen versorgen. Sie können P5en-Instances auch verwenden, um anspruchsvolle HPC-Anwendungen in großem Maßstab in der pharmazeutischen Forschung, seismischen Analyse, Wettervorhersage und Finanzmodellierung bereitzustellen.
P5en-Instances verfügen über 8 H200-GPUs, die eine 1,7-fach höhere GPU-Speichergröße und eine 1,5-fach größere GPU-Speicherbandbreite haben, als die H100-GPUs, die in P5-Instances enthalten sind. P5en-Instances koppeln die H200-GPUs mit hochleistungsfähigen, benutzerdefinierten Intel Xeon Scalable-Prozessoren der 4. Generation und ermöglichen somit die PCIe der 5.Gen. zwischen CPU und GPU, was die Bandbreite zwischen CPU und GPU beinahe vervierfacht und die KI-Trainings- und Inferenzleistung steigert. Durch die max. 3200 Gbit/s der dritten Generation von EFA, und die Verwendung von Version Nitro v5, zeigt P5en eine Verbesserung der Latenz um bis zu 35 % im Vergleich zu P5, das die vorherige Generation von EFA und Nitro verwendet. Dies trägt dazu bei, die kollektive Kommunikationsleistung für verteilte Trainingsworkloads wie Anwendungen des Deep Learnings, generativer KI, der Echtzeitdatenverarbeitung und des High-Performance Computings (HPC) zu verbessern. Um die Kundenanforderungen für niedrige Latenz in einem großen Maßstab gerecht zu werden, werden P5en-Instances in Amazon EC2 UltraClusters bereitgestellt und marktführende Skalierungsfunktionen für verteilte Schulungen und eng gekoppelte HPC-Workloads angeboten.
P5en-Instances sind jetzt in den AWS-Regionen USA Ost (Ohio), USA West (Oregon) und Asien-Pazifik (Tokio) sowie in der Local Zone USA Ost (Atlanta) us-east-1-atl-2a in der Größe p5en.48xlarge verfügbar.
Weitere Informationen zu P5en-Instances finden Sie unter Amazon-EC2-P5en-Instances.