AWS Neuron SDK 2.26.0 출시
오늘 AWS는 Neuron SDK 2.26.0의 정식 버전을 발표했습니다. 이번 버전은 AWS Inferentia 및 Trainium 인스턴스에서 딥 러닝 워크로드 성능을 개선합니다. 이번 릴리스에는 PyTorch 2.8 및 JAX 0.6.2 지원이 추가되었으며, Trainium2(Trn2) 인스턴스에서 향상된 추론 기능을 제공합니다. 이번 업데이트를 통해 개발자는 최신 프레임워크를 활용하면서 향상된 모델 배포 유연성과 성능 최적화의 이점을 누릴 수 있습니다.
Neuron SDK 2.26.0을 사용하면 Trn2 인스턴스에서 FLUX.1-dev 이미지 생성 모델과 Llama 4 Scout 및 Maverick 변형(베타)을 배포할 수 있습니다. 이번 릴리스에서는 Mixture-of-Experts(MoE) 모델을 여러 NeuronCore에 효율적으로 분산하기 위한 전문가 병렬 처리 지원(베타)이 도입되고, 새로운 Neuron Kernel Interface(NKI) API를 통해 새로운 기능도 추가되었습니다. 업데이트된 Neuron Profiler는 분산 워크로드를 위한 시스템 프로필 그룹화 등 향상된 기능을 제공합니다.
새로운 SDK 버전은 Inferentia 및 Trainium 인스턴스를 지원하는 모든 AWS 리전에서 사용할 수 있으며, 기계 학습 워크로드를 위한 향상된 성능과 모니터링 기능을 제공합니다.
자세한 내용을 알아보고 새로운 기능 및 개선 사항의 전체 목록을 확인하려면 다음을 참조하세요.