宣布推出 AWS Neuron SDK 2.25.0

发布于: 2025年8月21日

今天,AWS 宣布全面推出 Neuron SDK 2.25.0,改进了 AWS Inferentia 和 Trainium 实例的推理工作负载和性能监控。该最新版本增加了上下文和数据并行支持以及用于推理中的长序列处理的分块注意力,并更新了 neuron-ls API 和 neuron-monitor API,分别提供了有关节点亲和性和设备利用率的更多信息。

此版本还引入了用于快速张量操作的自动化别名 (Beta),并增加了对细分服务的改进 (Beta)。最后,它为 Neuron 上的推理和训练工作负载提供了升级的 AMI 和深度学习容器。

Neuron 2.25.0 现已在所有提供 Inferentia 和 Trainium 实例的 AWS 区域推出。

要了解更多信息以及新功能和增强功能的完整列表,请参阅: