P5en-Instances von Amazon EC2 sind jetzt in der AWS-Region USA West (Nordkalifornien) verfügbar

Veröffentlicht am: 6. Mai 2025

Ab heute sind P5en-Instances von Amazon Elastic Compute Cloud (Amazon EC2) mit NVIDIA-H200-GPUs in der AWS-Region USA West (Nordkalifornien) verfügbar. Diese Instances sind für generative KI- und High Performance Computing (HPC)-Anwendungen optimiert.

P5en-Instances verfügen über 8 H200-GPUs mit der 1,7-fachen GPU-Speichergröße und 1,4-fachen GPU-Speicherbandbreite als die in P5-Instances verwendeten H100-GPUs. P5en-Instances koppeln die H200-GPUs mit hochleistungsfähigen, benutzerdefinierten Intel Xeon Scalable-Prozessoren der 4. Generation und ermöglichen somit die PCIe der 5.Gen. zwischen CPU und GPU, was die Bandbreite zwischen CPU und GPU beinahe vervierfacht und die KI-Trainings- und Inferenzleistung steigert. Durch die max. 3200 Gbit/s der dritten Generation von EFA, und die Verwendung von Version Nitro v5, zeigt P5en eine Verbesserung der Latenz um bis zu 35 % im Vergleich zu P5, das die vorherige Generation von EFA und Nitro verwendet. Dies trägt dazu bei, die kollektive Kommunikationsleistung für verteilte Trainingsworkloads wie Anwendungen des Deep Learnings, generativer KI, der Echtzeitdatenverarbeitung und des High-Performance Computings (HPC) zu verbessern. Um die Kundenanforderungen für niedrige Latenz in einem großen Maßstab gerecht zu werden, werden P5en-Instances in Amazon EC2 UltraClusters bereitgestellt und marktführende Skalierungsfunktionen für verteilte Schulungen und eng gekoppelte HPC-Workloads angeboten.

Weitere Informationen zu P5en-Instances finden Sie unter Amazon-EC2-P5en-Instances.