AWS Neuron 2.30.0 è ora disponibile con NKI 0.4.0 e 22 nuovi kernel della libreria NKI

Inserito il: 26 mag 2026

Oggi AWS annuncia la disponibilità al pubblico di AWS Neuron 2.30.0, che introduce NKI 0.4.0 con nuove funzionalità hardware specifiche per AWS Trainium3, 22 nuovi kernel della libreria NKI e funzionalità ampliate di Neuron Agentic Development per il porting e la validazione dei modelli. Questa release è pensata per gli sviluppatori di machine learning che creano kernel personalizzati, ottimizzano carichi di lavoro di addestramento e inferenza o effettuano il porting di modelli su AWS Trainium e Inferentia.

NKI 0.4.0 introduce l'istruzione activate2 Scalar Engine per Trn3, il supporto agli input OCP FP8 per la moltiplicazione di matrici e costanti per la dimensione dei tile con allineamento ai byte, che semplificano lo sviluppo dei kernel. La libreria NKI introduce 3 nuovi kernel fondamentali per segmented attention, KV-parallel prefill e quantizzazione FP8, oltre a 19 kernel sperimentali che coprono il parallelismo contestuale, l'addestramento MXFP8, i modelli state-space e gli ottimizzatori fused. Le implementazioni di riferimento in PyTorch sono ora disponibili per 29 kernel.

Neuron Agentic Development, lanciato in versione beta nell'aprile 2026, aggiunge due nuove funzionalità: neuron-framework-autoport per il porting end-to-end di modelli HuggingFace su NxD Inference e neuron-framework-equivalence per la validazione dell'equivalenza numerica dei modelli sottoposti a porting. Entrambe sono ora incluse per impostazione predefinita in tutti i Neuron DLAMIs e Deep Learning Containers. Questa release introduce inoltre il Neuron DRA Driver per la Dynamic Resource Allocation di Kubernetes, che consente la pianificazione basata sulla topologia degli acceleratori Trainium e delle interfacce Elastic Fabric Adapter (EFA). Il Neuron Graph Compiler offre ora significativi miglioramenti in fase di compilazione, mentre il Neuron Runtime abilita per impostazione predefinita i trasferimenti host-device zero-copy.

AWS Neuron è disponibile in tutte le regioni AWS in cui sono supportate le istanze Amazon EC2 Trn1, Trn2, Inf2 e Inf1. Per informazioni sulla disponibilità regionale, consulta la tabella delle regioni AWS.

Per iniziare, consulta le seguenti risorse: