P6e-GB200 UltraServer von Amazon liefern jetzt höchste GPU-Leistung in EC2

Veröffentlicht am: 9. Juli 2025

Heute kündigt Amazon die allgemeine Verfügbarkeit des P6e-GB200 UltraServers von Amazon Elastic Compute Cloud (Amazon EC2) mit dem Beschleuniger NVIDIA GB200 NVL72 an. Amazon EC2 P6e-GB200 UltraServer bieten die höchste GPU-basierte KI-Trainings- und Inferenzleistung in EC2. Sie wurden entwickelt, um das Training und die Inferenz von Basismodellen (FMs) mit Billionen Parametern zu beschleunigen, einschließlich Funktionen der nächsten Generation wie Argumentationsmodelle und agentenbasierter KI.

Bei P6e-GB200 UltraServern können Kunden auf bis zu 72 Blackwell-GPUs innerhalb einer NVLink-Domain zugreifen, um 360 Petaflops an FP8-Rechenleistung (ohne Sparsity), 13,4 TB Gesamtspeicher mit hoher Bandbreite (HBM3e) und bis zu 28,8 Tbit/s an Elastic Fabric Adapter (eFAV4)-Netzwerkleistung zu nutzen.  Die P6e-GB200 UltraServer werden vom AWS Nitro System unterstützt, sodass Kunden KI-Workloads innerhalb von EC2 UltraClustern zuverlässig und sicher auf Zehntausende von GPUs skalieren können. 

P6e-GB200 UltraServer sind jetzt über Amazon EC2 Capacity Blocks für ML in der Dallas Local Zone („us-east-1-dfw-2a“), einer Erweiterung der Region USA Ost (Nord-Virginia), erhältlich. P6e-GB200 UltraServer sind in zwei Größen erhältlich: u-p6e-gb200x72 (72 GPUs innerhalb von NVLink) und u-p6e-gb200x36 (36 GPUs innerhalb von NVLink).

Weitere Informationen finden Sie unter Amazon EC2 P6e-GB200 UltraServer und P6-B200-Instances.