Anúncio do AWS Neuron SDK 2.25.0

Publicado: 21 de ago de 2025

Hoje, a AWS anuncia a disponibilidade geral do Neuron SDK 2.25.0, que oferece melhorias para workloads de inferência e monitoramento de performance em instâncias AWS Inferentia e Trainium. Esta versão mais recente adiciona suporte ao contexto e ao paralelismo de dados, bem como atenção fragmentada ao processamento de sequências longas em inferência, e atualiza as APIs neuron-ls e neuron-monitor com mais informações sobre afinidades de nós e utilização de dispositivos, respectivamente.

Esta versão também introduz o aliasing automático (beta) para operações rápidas de tensores e adiciona melhorias para o serviço desagregado (beta). Por fim, ela oferece AMIs e contêineres de aprendizado profundo atualizados para workloads de inferência e treinamento no Neuron.

O Neuron 2.25.0 está disponível em todas as regiões da AWS que oferecem as instâncias do Inferentia e Trainium.

Para saber mais e obter uma lista completa de novos atributos e aprimoramentos, consulte: