Le istanze Amazon EC2 Inf2 sono ora disponibili in Corea

Inserito il: 7 mag 2025

Da oggi le istanze Amazon Elastic Compute Cloud (Amazon EC2) Inf2, ottimizzate per l'IA generativa, sono disponibili al pubblico nella regione AWS Asia Pacifico (Seoul). Le istanze Amazon EC2 Inf2 consentono di ridurre i costi di inferenza fino al 40% rispetto ad altre istanze Amazon EC2 equivalenti.

È possibile utilizzare le istanze Inf2 per eseguire le applicazioni più utilizzate quali il riepilogo del testo, la generazione di codice, la generazione di video e immagini, il riconoscimento vocale, la personalizzazione e altro ancora. Le istanze Inf2 sono le prime istanze di Amazon EC2 ottimizzate per l'inferenza a introdurre l'inferenza distribuita scalabile supportata da NeuronLink, un'interconnessione ad alta velocità e senza blocchi. Le istanze Inf2 offrono fino a 2,3 petaflop e fino a 384 GB di memoria totale dell'acceleratore con una larghezza di banda di 9,8 TB/s.

L'SDK AWS Neuron si integra in modo nativo con i più diffusi framework di machine learning, così puoi continuare a utilizzare quelli esistenti per l'implementazione su Inf2. Gli sviluppatori possono iniziare a usare le istanze Inf2 utilizzando le AWS Deep Learning AMI, i container AWS Deep Learning o i servizi gestiti come Amazon Elastic Container Service (Amazon ECS), Amazon Elastic Kubernetes Service (Amazon EKS) e Amazon SageMaker.

Le istanze Inf2 sono ora disponibili in quattro dimensioni: inf2.xlarge, inf2.8xlarge, inf2.24xlarge e inf2.48xlarge in 14 Regioni AWS, come istanze on-demand, istanze riservate e istanze spot, oppure come parte di un piano di risparmio.

Per ulteriori informazioni sulle istanze Inf2, consultare la pagina web delle istanze Amazon EC2 Inf2 e la documentazione di AWS Neuron.