Le istanze Amazon P6e-GB200 UltraServers sono ora disponibili per offrire massime prestazioni GPU su EC2
Oggi Amazon rende disponibile al pubblico le istanze Amazon Elastic Compute Cloud (Amazon EC2) P6e-GB200 UltraServers con accelerazione NVIDIA GB200 NVL72. Le istanze Amazon EC2 P6e-GB200 UltraServers offrono le massime prestazioni di addestramento e inferenza IA basate su GPU in EC2. Sono progettati per accelerare addestramento e inferenza dei modelli di fondazione (FM), comprese funzionalità di nuova generazione come i modelli di ragionamento e l'IA agentica con trilioni di parametri.
Con P6e-GB200 UltraServers i clienti possono accedere fino a 72 GPU Blackwell all'interno di un unico dominio NVLink, sfruttando 360 petaflop di calcolo FP8 (senza sparsità), 13,4 TB di memoria totale a larghezza di banda ampia (HBM3e) e fino a 28,8 Tbps di rete Elastic Fabric Adapter (EFAv4). Le istanze P6e-GB200 UltraServers sono basate su AWS Nitro System, consentendo ai clienti di scalare in modo affidabile e sicuro i carichi di lavoro di IA all'interno degli EC2 UltraClusters fino a decine di migliaia di GPU.
Le istanze P6e-GB200 UltraServers sono ora disponibili tramite i Blocchi di capacità Amazon EC2 per ML nella AWS Local Zone di Dallas ("us-east-1-dfw-2a"), un'estensione della regione AWS Stati Uniti orientali (Virginia settentrionale). Le istanze P6e-GB200 UltraServers sono disponibili in due dimensioni: u-p6e-gb200x72 (72 GPU all'interno di NVLink) e u-p6e-gb200x36 (36 GPU all'interno di NVLink).
Per ulteriori informazioni, fai riferimento alle istanze Amazon EC2 P6e-GB200 UltraServers e P6-B200.