Introduzione di AWS Neuron SDK 2.25.0

Inserito il: 21 ago 2025

Oggi AWS rende disponibile al pubblico Neuron SDK 2.25.0, che apporta miglioramenti ai carichi di lavoro di inferenza e al monitoraggio delle prestazioni sulle istanze AWS Inferentia e Trainium. Questa versione più recente aggiunge il supporto per la parallelizzazione del contesto e dei dati, nonché l'attenzione frammentata per l'elaborazione di sequenze lunghe nell'inferenza, e aggiorna le API neuron-ls e neuron-monitor con maggiori informazioni sulle affinità dei nodi e sull'utilizzo dei dispositivi.

Questa versione introduce inoltre l'aliasing automatico (Beta) per operazioni rapide sui tensor e apporta ottimizzazioni per l'erogazione del servizio in modalità disaggregata (Beta). Infine, fornisce AMI aggiornate e container per il deep learning destinati ai carichi di lavoro di inferenza e addestramento su Neuron.

Neuron 2.25.0 è disponibile in tutte le regioni AWS in cui sono supportate le istanze Inferentia e Trainium.

Per ulteriori informazioni e per l'elenco completo delle nuove funzionalità e dei miglioramenti, consulta: