Le istanze G7e di Amazon EC2 sono ora disponibili al pubblico
Oggi, Amazon annuncia la disponibilità generale delle istanze Amazon Elastic Compute Cloud (Amazon EC2) G7e, accelerate dalle GPU NVIDIA RTX PRO 6000 Blackwell Server Edition. Le istanze G7e offrono prestazioni di inferenza fino a 2,3 volte superiori rispetto alle istanze G6e.
I clienti possono utilizzare le istanze G7e per implementare modelli linguistici di grandi dimensioni (LLM), IA agentica, IA generativa multimodale e modelli IA fisici. Le istanze G7e offrono le massime prestazioni per i carichi di lavoro di calcolo spaziale, nonché per i carichi di lavoro che richiedono capacità di elaborazione grafica e IA. Le istanze G7e sono dotate di fino a 8 GPU NVIDIA RTX PRO 6000 Blackwell Server Edition, con 96 GB di memoria per GPU e processori Intel Xeon di quinta generazione. Supportano fino a 192 CPU virtuali (vCPU) e fino a 1600 Gbps di larghezza di banda della rete Elastic Fabric Adapter. Le istanze G7e supportano NVIDIA GPUDirect Peer to Peer (P2P), che aumenta le prestazioni per carichi di lavoro multi-GPU. Le istanze G7e multi-GPU supportano anche NVIDIA GPUDirect Remote Direct Memory Access (RDMA) con EFAv4 in EC2 UltraClusters, riducendo la latenza per carichi di lavoro multinodo su piccola scala.
Puoi utilizzare le istanze G7e per Amazon EC2 nelle seguenti regioni AWS: Stati Uniti orientali (Virginia settentrionale) e Stati Uniti orientali (Ohio). Ora puoi acquistare le istanze G7e come istanze on demand, istanze spot o come parte di Savings Plans.
Per iniziare, vai alla console di gestione AWS, all'interfaccia a riga di comando (CLI) di AWS e agli SDK di AWS. Per ulteriori informazioni, visita Istanze G7e.