Introduzione di AWS Neuron SDK 2.26.0
Oggi AWS rende disponibile al pubblico Neuron SDK 2.26.0, che offre miglioramenti per i carichi di lavoro di deep learning su istanze AWS Inferentia e Trainium. Questa versione introduce il supporto per PyTorch 2.8 e JAX 0.6.2, oltre a funzionalità di inferenza avanzate sulle istanze Trainium2 (Trn2). Questi aggiornamenti consentono agli sviluppatori di sfruttare i framework più recenti beneficiando al contempo di una maggiore flessibilità di implementazione dei modelli e delle ottimizzazioni delle prestazioni.
Ora, tramite Neuron SDK 2.26.0, i clienti possono implementare il modello di generazione di immagini Flux.1-dev, insieme alle varianti Llama 4 Scout e Maverick (beta) sulle istanze Trn2. La versione introduce il supporto per il parallelismo tra esperti (beta) per una distribuzione efficiente dei modelli Mixture-of-Experts (MoE) su più NeuronCore e aggiunge nuove funzionalità tramite nuove API Neuron Kernel Interface (NKI). Neuron Profiler aggiornato offre funzionalità migliorate, incluso il raggruppamento dei profili di sistema per carichi di lavoro distribuiti.
La nuova versione SDK è disponibile in tutte le regioni AWS che supportano le istanze Inferentia e Trainium, offrendo prestazioni e funzionalità di monitoraggio migliorate per i carichi di lavoro di machine learning.
Per ulteriori informazioni e per l'elenco completo delle nuove funzionalità e dei miglioramenti, consulta: