AWS Neuron 2.24 的新功能包括 PyTorch 2.7 和推論增強功能

張貼日期: 2025年7月2日

今天，AWS 宣布 Neuron 2.24 全面上市，為在 AWS Inferentia 和 Trainium 執行個體上建置及部署深度學習模型的客戶，帶來新功能和效能提升。Neuron 2.24 引進對 PyTorch 2.7 的支援、增強推論功能，並擴展了與流行機器學習框架的相容性。這些更新有助於開發人員和資料科學家加速模型訓練與推論、提升效率，並簡化大型語言模型及其他 AI 工作負載的部署。

藉由 Neuron 2.24，客戶可以利用多種進階推論功能。例如，透過前綴快取縮短第一個字符時間 (TTFT)、運用解耦推論減少預填充到解碼之間的干擾，以及使用內容平行處理來提升長序列的效能。這個版本也支援 Qwen 2.5 文字模型，並改進了與 Hugging Face Optimum Neuron 和基於 PyTorch 的 NxD Core 後端的整合。

Neuron 2.24 適用於所有提供 Inferentia 和 Trainium 執行個體的 AWS 區域。

若要進一步了解並瀏覽全新功能和增強功能完整清單，請參閱：

AWS Neuron 2.24 的新功能包括 PyTorch 2.7 和推論增強功能

了解

資源

開發人員

說明