Anunciamos AWS Neuron SDK 2.25.0
Hoy, AWS anuncia la disponibilidad general de Neuron SDK 2.25.0, que ofrece mejoras para las cargas de trabajo de inferencia y monitoreo del rendimiento en las instancias de AWS Inferentia y AWS Trainium. Esta última versión agrega compatibilidad con el contexto y el paralelismo de datos, así como una atención fragmentada para el procesamiento de secuencias largas en inferencias, y actualiza las API neuron-ls y neuron-monitor con más información sobre las afinidades de los nodos y la utilización de los dispositivos, respectivamente.
Esta versión también introduce la generación automática de alias (Beta) para operaciones rápidas con tensores y agrega mejoras para la entrega desagregada (Beta). Por último, proporciona AMI y contenedores de aprendizaje profundo con mejoras para cargas de trabajo de inferencia y entrenamiento en Neuron.
Neuron 2.25.0 está disponible en todas las regiones de AWS en las que se ofrecen instancias de AWS Inferentia y AWS Trainium.
Para obtener más información y una lista completa de las nuevas funciones y mejoras, consulte: