Annonce du SDK AWS Neuron 2.26.0
AWS annonce aujourd'hui la disponibilité générale de Neuron SDK 2.26.0, qui apporte des améliorations aux charges de travail de deep learning sur les instances basées sur AWS Inferentia et Trainium. Cette version introduit la prise en charge de PyTorch 2.8 et JAX 0.6.2, ainsi que des fonctionnalités d'inférence améliorées sur les instances Trainium2 (Trn2). Ces mises à jour permettent aux développeurs de tirer parti des derniers cadres tout en bénéficiant d'une flexibilité de déploiement de modèles améliorée et d'une optimisation des performances.
Avec Neuron SDK 2.26.0, les clients peuvent désormais déployer le modèle de génération d'images Flux.1-dev, ainsi que les variantes Llama 4 Scout et Maverick (bêta) sur les instances Trn2. Cette version introduit la prise en charge du parallélisme expert (bêta) pour une distribution efficace des modèles Mixture-of-Experts (MoE) sur plusieurs NeuronCores, et ajoute de nouvelles fonctionnalités via les nouvelles API Neuron Kernel Interface (NKI). Le Neuron Profiler mis à jour offre des fonctionnalités améliorées, notamment le regroupement de profils système pour les charges de travail distribuées.
La nouvelle version du SDK est disponible dans toutes les régions AWS prenant en charge les instances Inferentia et Trainium, offrant des performances et des fonctionnalités de surveillance améliorées pour les charges de travail de machine learning.
Pour en savoir plus et obtenir la liste complète des nouvelles fonctionnalités et améliorations, consultez :