AWS Neuron 2.30.0 ya está disponible con NKI 0.4.0 y 22 nuevos kernels de la biblioteca NKI

Publicado en: 26 de may de 2026

Hoy, AWS anuncia la disponibilidad general de AWS Neuron 2.30.0, que ofrece NKI 0.4.0 con nuevas capacidades de hardware específicas de AWS Trainium3, 22 nuevos kernels de la biblioteca NKI y habilidades ampliadas de Neuron Agentic Development para la portabilidad y validación de modelos. Esta versión está dirigida a los desarrolladores de aprendizaje automático que crean kernels personalizados, optimizan las cargas de trabajo de entrenamiento e inferencia o transfieren modelos a AWS Trainium e Inferentia.

NKI 0.4.0 presenta la instrucción activate2 Scalar Engine para Trn3, el soporte de entrada OCP FP8 para la multiplicación de matrices y las constantes bytes-aware tile-size que simplifican el desarrollo del kernel. La biblioteca NKI agrega 3 nuevos kernels principales para la atención segmentada, la precarga en paralelo KV y la cuantificación de FP8, así como 19 kernels experimentales que cubren el paralelismo de contextos, el entrenamiento de MXFP8, los modelos de espacio de estados y los optimizadores fusionados. Las implementaciones de referencia de PyTorch ahora están disponibles para 29 kernels.

Neuron Agentic Development, que se lanzó como versión beta en abril de 2026, agrega dos nuevas habilidades: neuron-framework-autoport para portar los modelos de HuggingFace a NxD Inference de extremo a extremo y neuron-framework-equivalence para validar la equivalencia numérica de los modelos portados. Ambos están ahora incluidos de forma predeterminada en todos los contenedores DLAMI y de aprendizaje profundo de Neuron. Esta versión también presenta el controlador Neuron DRA para la asignación dinámica de recursos de Kubernetes, que permite la programación con reconocimiento de topología de los aceleradores Trainium y las interfaces de Elastic Fabric Adapter (EFA). Neuron Graph Compiler ahora ofrece mejoras significativas en el tiempo de compilación, y Neuron Runtime permite transferencias sin copias entre dispositivos host de forma predeterminada.

AWS Neuron está disponible en todas las regiones de AWS en las que están disponibles las instancias Trn1, Trn2, Inf2 e Inf1 de Amazon EC2. Para obtener más información acerca de la disponibilidad regional, consulte la Tabla de regiones de AWS.

Para comenzar, consulte los siguientes recursos: