AWS Neuron 2.30.0 est désormais disponible avec NKI 0.4.0 et 22 nouveaux noyaux de bibliothèque NKI

Publié le: 26 mai 2026

AWS annonce aujourd’hui la disponibilité générale d’AWS Neuron 2.30.0, qui fournit NKI 0.4.0 avec de nouvelles fonctionnalités matérielles spécifiques à AWS Trainium3, 22 nouveaux noyaux de bibliothèque NKI et des compétences étendues de Neuron Agentic Development en matière de portage et de validation de modèles. Cette version est destinée aux développeurs ML qui créent des noyaux personnalisés, optimisent les charges de travail de formation et d’inférence, ou portent des modèles vers AWS Trainium et Inferentia.

NKI 0.4.0 introduit l’instruction activate2 Scalar Engine pour Trn3, la prise en charge des entrées OCP FP8 pour la multiplication matricielle et des constantes de taille de tuile sensibles aux octets qui simplifient le développement du noyau. La bibliothèque NKI ajoute 3 nouveaux noyaux principaux pour l’attention segmentée, le préremplissage parallèle au KV et la quantification FP8, ainsi que 19 noyaux expérimentaux couvrant le parallélisme des contextes, l’entraînement MXFP8, les modèles d’espace d’états et les optimiseurs fusionnés. Les implémentations de référence de PyTorch sont désormais disponibles pour 29 noyaux.

Neuron Agentic Development, lancé en version bêta en avril 2026, ajoute deux nouvelles compétences : neuron-framework-autoport pour porter les modèles HuggingFace vers NxD Inference de bout en bout, et neuron-framework-equivalence pour valider l’équivalence numérique des modèles portés. Par défaut, les deux sont désormais inclus dans tous les conteneurs Neuron DLAMIS et Deep Learning. Cette version introduit également le pilote Neuron DRA pour l’allocation dynamique des ressources de Kubernetes, qui permet de planifier les accélérateurs Trainium et les interfaces Elastic Fabric Adapter (EFA) en tenant compte de l’ordonnancement topologique. Le compilateur Neuron Graph apporte désormais des améliorations significatives au moment de la compilation, et l’environnement d’exécution Neuron permet par défaut des transferts hôte-périphérique sans copie.

AWS Neuron est disponible dans toutes les Régions AWS où les instances Amazon EC2 Trn1, Trn2, Inf2 et Inf1 sont disponibles. Pour en savoir plus sur la disponibilité régionale, consultez le tableau des régions AWS.

Pour commencer, consultez les ressources suivantes :