Anúncio do AWS Neuron SDK 2.26.0
Hoje, a AWS anuncia a disponibilidade geral do Neuron SDK 2.26.0, oferecendo melhorias para workloads de aprendizado profundo em instâncias baseadas no AWS Inferentia e no Trainium. Essa versão apresenta o suporte para PyTorch 2.8 e JAX 0.6.2, além de recursos aprimorados de inferência em instâncias Trainium2 (Trn2). Essas atualizações permitem que os desenvolvedores aproveitem as estruturas mais recentes e, ao mesmo tempo, se beneficiem da maior flexibilidade de implantação do modelo e das otimizações de performance.
Com o Neuron SDK 2.26.0, os clientes agora podem implantar o modelo de geração de imagens FLUX.1-dev, junto com as variantes Llama 4 Scout e Maverick (beta) em instâncias Trn2. A versão apresenta suporte especializado em paralelismo (beta) para distribuição eficiente de modelos de mistura de especialistas (MoE) em vários NeuronCores e adiciona novos recursos por meio de novas APIs da Neuron Kernel Interface (NKI). O Neuron Profiler atualizado fornece recursos aprimorados, incluindo agrupamento de perfis de sistema para workloads distribuídas.
A nova versão do SDK está disponível em todas as regiões da AWS que oferecem suporte às instâncias Inferentia e Trainium, oferecendo performance aprimorada e recursos de monitoramento para workloads de machine learning.
Para saber mais e obter uma lista completa de novos atributos e aprimoramentos, consulte: