Amazon-EC2-P5en-Instances sind jetzt in USA Ost (Nord-Virginia) und Asien-Pazifik (Jakarta) verfügbar

Veröffentlicht am: 27. März 2025

Ab heute sind Amazon-Elastic-Compute-Cloud-(Amazon EC2)-P5en-Instances mit NVIDIA-H200-GPUs in den Regionen USA Ost (Nord-Virginia) und Asien-Pazifik (Jakarta) verfügbar. Diese Instances sind für generative KI- und High Performance Computing (HPC)-Anwendungen optimiert.

P5en-Instances verfügen über 8 H200-GPUs mit der 1,7-fachen GPU-Speichergröße und 1,4-fachen GPU-Speicherbandbreite als die in P5-Instances verwendeten H100-GPUs. P5en-Instances koppeln die H200-GPUs mit hochleistungsfähigen, benutzerdefinierten Intel Xeon Scalable-Prozessoren der 4. Generation und ermöglichen somit die PCIe der 5.Gen. zwischen CPU und GPU, was die Bandbreite zwischen CPU und GPU beinahe vervierfacht und die KI-Trainings- und Inferenzleistung steigert. Durch die max. 3200 Gbit/s der dritten Generation von EFA, und die Verwendung von Version Nitro v5, zeigt P5en eine Verbesserung der Latenz um bis zu 35 % im Vergleich zu P5, das die vorherige Generation von EFA und Nitro verwendet. Dies trägt dazu bei, die kollektive Kommunikationsleistung für verteilte Trainingsworkloads wie Anwendungen des Deep Learnings, generativer KI, der Echtzeitdatenverarbeitung und des High-Performance Computings (HPC) zu verbessern. Um die Kundenanforderungen für niedrige Latenz in einem großen Maßstab gerecht zu werden, werden P5en-Instances in Amazon EC2 UltraClusters bereitgestellt und marktführende Skalierungsfunktionen für verteilte Schulungen und eng gekoppelte HPC-Workloads angeboten.

Mit diesen zusätzlichen Regionen sind P5en-Instances jetzt in den AWS-Regionen USA Ost (Nord-Virginia, Ohio), USA West (Oregon), Europa (Spanien) und Asien-Pazifik (Jakarta, Mumbai, Seoul, Tokio und Seoul) sowie in der lokalen Zone USA Ost (Atlanta) us-east-1-atl-2a in der Größe p5en.48xlarge verfügbar.

Weitere Informationen zu P5en-Instances finden Sie unter Amazon-EC2-P5en-Instances.