Anunciamos AWS Neuron SDK 2.26.0

Publicado en: 19 de sep de 2025

Hoy, AWS anuncia la disponibilidad general del SDK 2.26.0 de Neuron, que ofrece mejoras para las cargas de trabajo de aprendizaje profundo en las instancias basadas en AWS Inferentia y Trainium. Esta versión incluye compatibilidad con PyTorch 2.8 y JAX 0.6.2, junto con capacidades de inferencia mejoradas en instancias de Trainium2 (Trn2). Estas actualizaciones permiten que los desarrolladores aprovechen los marcos más recientes y, al mismo tiempo, se beneficien de una mayor flexibilidad para la implementación de modelos y las optimizaciones del rendimiento.

Con el SDK 2.26.0 de Neuron, los clientes ahora pueden implementar el modelo de generación de imágenes FLUX.1-dev, junto con las variantes Llama 4 Scout y Maverick (beta) en las instancias de Trn2. La versión presenta la compatibilidad del paralelismo de expertos (beta) para una distribución eficiente de modelos de mezcla de expertos (Mixture-of-Experts, MoE) en varios NeuronCore, y agrega nuevas capacidades a través de las nuevas API de Neuron Kernel Interface (NKI). La actualización de Neuron Profiler ofrece capacidades mejoradas, incluida la agrupación de perfiles del sistema para cargas de trabajo distribuidas.

La nueva versión del SDK está disponible en todas las regiones de AWS que admiten instancias de Inferentia y Trainium, y ofrece capacidades de supervisión y rendimiento mejorados para las cargas de trabajo de machine learning.

Para obtener más información y una lista completa de las nuevas funciones y mejoras, consulte: