Le istanze Amazon EC2 P5 con singola GPU sono ora disponibili al pubblico
Oggi AWS presenta la nuova dimensione di istanza Amazon Elastic Compute Cloud (Amazon EC2) P5 dotata di GPU NVIDIA H100, che consente alle aziende di dimensionare correttamente le proprie risorse di machine learning (ML) e calcolo ad alte prestazioni (HPC) in modo più conveniente.
La nuova dimensione dell'istanza permette ai clienti di partire da esigenze ridotte e crescere gradualmente, offrendo un controllo più flessibile sui costi dell'infrastruttura. I clienti che sviluppano modelli linguistici di grandi dimensioni (LLM) di piccola o media scala, come chatbot o strumenti specializzati di traduzione linguistica, ora possono eseguire attività di inferenza in modo più economico. Possono anche utilizzare queste istanze per implementare applicazioni HPC per la scoperta farmaceutica, l'analisi del flusso dei fluidi e la modellazione finanziaria senza dover investire in costose implementazioni GPU su larga scala.
Le istanze P5.4xlarge sono ora disponibili tramite Blocchi di capacità Amazon EC2 per ML nelle seguenti regioni AWS: Stati Uniti orientali (Virginia settentrionale, Ohio), Stati Uniti occidentali (Oregon), Europa (Londra), Asia Pacifico (Mumbai, Sydney, Tokyo) e Sud America (San Paolo). Possono essere acquistate in modalità on demand, spot o Savings Plans nelle regioni Europa (Londra), Asia Pacifico (Mumbai, Giacarta, Tokyo) e Sud America (San Paolo).
Per ulteriori informazioni sulle istanze P5.4xlarge, consulta la pagina delle istanze Amazon EC2 P5.