Inserito il: Dec 3, 2019
Oggi annunciamo la disponibilità al pubblico delle istanze Inf1 di Amazon EC2, create da zero per supportare le applicazioni di inferenza di machine learning. Le istanze Inf1 presentano fino a 16 chip AWS Inferentia, chip di inferenza di machine learning ad alte prestazioni progettati e realizzati da AWS. Inoltre, abbiamo abbinato i chip Inferentia ai più recenti processori scalabili Intel® Xeon® di seconda generazione personalizzati e a una rete che raggiunge i 100 Gb/s per consentire un'inferenza a throughput elevato. Questa potente configurazione permette alle istanze Inf1 di offrire un throughput fino a 3 volte superiore e un costo per inferenza fino al 40% inferiore rispetto alle istanze G4 di Amazon EC2, che erano già le istanze più economiche per l'inferenza di machine learning disponibili nel cloud.
Le istanze Inf1 di Amazon EC2 garantiscono prestazioni elevate e l'inferenza di machine learning più economica del cloud. Attraverso le istanze Inf1, i clienti possono eseguire applicazioni di inferenza di machine learning su larga scala come riconoscimento di immagini, riconoscimento vocale, elaborazione del linguaggio naturale, personalizzazione e rilevamento di frodi, al costo più basso disponibile nel cloud.
AWS consente di distribuire facilmente la propria applicazione di machine learning su istanze Inf1 di Amazon EC2. Una volta addestrato il modello, puoi usare AWS Neuron, un SDK per eseguire l'inferenza usando chip AWS Inferentia che consiste di strumenti di compilazione, runtime e profilazione. Neuron è preintegrato in framework popolari di machine learning come TensorFlow, Pytorch e MXNet che permettono prestazioni ottimali da parte delle istanze Inf1 di EC2. Le istanze Inf1 possono essere distribuite usando AMI di AWS Deep Learning e saranno disponibili attraverso servizi gestiti come Amazon SageMaker, EKS ed ECS.
Le istanze Inf1 di Amazon EC2 sono disponibili in 4 formati e nelle regioni AWS Stati Uniti orientali (Virginia settentrionale) e Stati Uniti occidentali (Oregon) come istanze on demand, riservate o Spot oppure come parte di un Savings Plan. Per ulteriori informazioni, visita la pagina sulle istanze Inf1.