AWS Neuron 2.30.0 agora disponível com NKI 0.4.0 e 22 novos kernels da NKI Library
Hoje, a AWS anuncia a disponibilidade geral do AWS Neuron 2.30.0, que entrega o NKI 0.4.0 com novas capacidades de hardware específicas do AWS Trainium3, 22 novos kernels da NKI Library e habilidades ampliadas de Neuron Agentic Development para portabilidade e validação de modelos. Esta versão é destinada a desenvolvedores de ML que criam kernels personalizados, otimizam workloads de treinamento e inferência ou fazem portabilidade de modelos para o AWS Trainium e o AWS Inferentia.
O NKI 0.4.0 introduz a instrução activate2 do Scalar Engine para o Trn3, suporte a entrada OCP FP8 para multiplicação de matrizes e constantes de tamanho de tile com reconhecimento de bytes, que simplificam o desenvolvimento de kernels. A NKI Library adiciona três novos kernels principais para atenção segmentada, pré-preenchimento paralelo de KV e quantização de FP8, bem como 19 kernels experimentais que abrangem paralelismo de contexto, treinamento MXFP8, modelos de espaço de estados e otimizadores fundidos. As implementações de referência do PyTorch agora estão disponíveis para 29 kernels.
O Neuron Agentic Development, lançado como beta em abril de 2026, adiciona duas novas habilidades: neuron‑framework‑autoport, para portar modelos do HuggingFace para o NxD Inference de ponta a ponta, e neuron‑framework‑equivalence, para validar a equivalência numérica de modelos portados. Por padrão, ambas agora estão incluídas em todas as Neuron DLAMIs e nos Deep Learning Containers. Esta versão também apresenta o Neuron DRA Driver para Kubernetes Dynamic Resource Allocation, o que permite o agendamento com reconhecimento de topologia dos aceleradores Trainium e das interfaces do Elastic Fabric Adapter (EFA). O Neuron Graph Compiler agora oferece melhorias significativas no tempo de compilação, e o Neuron Runtime permite transferências de dispositivo host sem cópia por padrão.
O AWS Neuron está disponível em todas as regiões da AWS que oferecem as instâncias Trn1, Trn2, Inf2 e Inf1 do Amazon EC2. Para obter mais informações sobre a disponibilidade regional, consulte a Tabela de regiões da AWS.
Para começar a usá-lo, consulte os seguintes recursos: