Amazon EC2 UltraClusters
Esegui applicazioni HPC e ML su larga scala
Perché Amazon EC2 UltraClusters?
Amazon Elastic Compute Cloud (Amazon EC2) UltraClusters consente di scalare fino a migliaia di GPU o chip ML/IA dedicati, come AWS Trainium, per ottenere l'accesso on demand a un supercomputer. Democratizzano l'accesso a prestazioni di supercalcolo per gli sviluppatori di machine learning (ML), IA generativa e calcolo ad alte prestazioni (HPC) attraverso un semplice modello di utilizzo con pagamento in base al consumo senza costi di configurazione o manutenzione. Le istanze Amazon EC2 implementate in UltraClusters EC2 includono istanze P6e-GB200, P6-B200, P5en, P5e, P5, P4d, Trn2 e Trn1.
Gli EC2 UltraClusters sono costituiti da migliaia di istanze EC2 accelerate collocate in una determinata zona di disponibilità AWS e interconnesse tramite la rete Elastic Fabric Adapter (EFA) in una rete non bloccante nell'ordine dei petabit. Gli EC2 UltraCluster forniscono anche l'accesso ad Amazon FSx for Lustre, uno storage condiviso completamente gestito basato sul più popolare file system parallelo ad alte prestazioni per elaborare rapidamente enormi set di dati su richiesta e su larga scala con latenze inferiori al millisecondo. Gli EC2 UltraClusters offrono funzionalità di scalabilità orizzontale per la formazione ML distribuita e carichi di lavoro HPC strettamente accoppiati.
Vantaggi
Tempi più rapidi per la soluzione per l'addestramento distribuito e l'HPC
Accesso on demand a un supercomputer exascale
Flessibilità per ottimizzare prestazioni e costi
Caratteristiche
Rete ad alte prestazioni
Archiviazione ad alte prestazioni
Istanze e UltraServer supportati
Ultraserver P6e-GB200
Accelerate da NVIDIA GB200 NVL72, le istanze P6e-GB200 in una configurazione UltraServer offrono le massime prestazioni di addestramento e inferenza IA tramite GPU in Amazon EC2.
Istanze P6-B200
Le istanze P6-B200 di Amazon EC2, basate su GPU NVIDIA Blackwell, offrono istanze ad alte prestazioni per l'addestramento dell'IA, l'inferenza e l'HPC.
Istanze Trn2 e UltraServer
Basate sui processori IA AWS Trainium2, le istanze Trn2 offrono un rapporto prezzo/prestazioni dal 30% al 40% migliore rispetto a quelle basate su GPU paragonabili.
Istanze P5en, P5e e P5
Le istanze P5en e P5e, basate sulle GPU NVIDIA H200 Tensor Core, offrono le prestazioni superiori in Amazon EC2 per l'addestramento ML e le applicazioni HPC. Le istanze P5 sono basate su GPU NVIDIA H100 Tensor Core.
Istanze P4d
Le istanze P4d, basate sulle GPU NVIDIA A100 Tensor Core, offrono prestazioni elevate per l'addestramento ML e le applicazioni HPC.
Istanze Trn1
Le istanze Trn1 basate su chip IA AWS Trainium, sono sviluppate appositamente per l'addestramento di ML ad alte prestazioni. Offrono fino al 50% di risparmi sui costi di addestramento rispetto alle istanze EC2 paragonabili.
Hai trovato quello che cercavi?
Facci sapere la tua opinione in modo da migliorare la qualità dei contenuti delle nostre pagine