Annonce du SDK AWS Neuron 2.25.0

Publié le: 21 août 2025

AWS annonce aujourd'hui la disponibilité générale du SDK Neuron 2.25.0, qui apporte des améliorations aux charges de travail d'inférence et à la surveillance des performances sur les instances AWS Inferentia et Trainium. Cette dernière version ajoute la prise en charge du parallélisme du contexte et des données ainsi qu'une attention particulière au traitement des séquences longues en inférence, et met à jour les API neuron-ls et neuron-monitor avec plus d'informations sur les affinités des nœuds et l'utilisation des appareils, respectivement.

Cette version introduit également l'alias automatique (bêta) pour des opérations tensorielles rapides et apporte des améliorations pour la diffusion désagrégée (bêta). Enfin, elle fournit des AMI et des Deep Learning Containers améliorés pour les charges de travail d'inférence et d’entraînement sur Neuron.

Neuron 2.25.0 est disponible dans toutes les régions AWS où les instances Inferentia et Trainium sont proposées.

Pour en savoir plus et obtenir la liste complète des nouvelles fonctionnalités et améliorations, consultez :