NKI 0.4.0 및 22개의 새로운 NKI 라이브러리 커널과 함께 AWS Neuron 2.30.0 출시

게시된 날짜: 2026년 5월 26일

오늘 AWS는 AWS Neuron 2.30.0의 정식 출시를 발표했습니다. 이번 버전에는 새로운 AWS Trainium3 전용 하드웨어 기능을 갖춘 NKI 0.4.0, 22개의 새로운 NKI 라이브러리 커널, 그리고 모델 포팅과 검증을 위한 확장된 Neuron 에이전트 개발 기능이 포함되어 있습니다. 이 릴리스는 사용자 지정 커널을 구축하거나, 훈련 및 추론 워크로드를 최적화하거나, 모델을 AWS Trainium과 Inferentia로 포팅하는 ML 개발자를 위한 것입니다.

NKI 0.4.0에는 Trn3용 activate2 스칼라 엔진 명령어, 행렬 곱셈을 위한 OCP FP8 입력 지원, 커널 개발을 간소화하는 바이트 인식 타일 크기 상수가 도입되었습니다. NKI 라이브러리에는 분할된 어텐션, KV 병렬 프리필, FP8 양자화를 위한 3개의 새로운 코어 커널과 컨텍스트 병렬 처리, MXFP8 훈련, 상태 공간 모델, 융합된 최적화 도구를 다루는 19개의 실험적 커널이 추가되었습니다. 이제 29개 커널에 PyTorch 참조 구현을 사용할 수 있습니다.

2026년 4월 베타 버전으로 출시된 Neuron Agentic Development에는 HuggingFace 모델을 NxD Inference로 엔드투엔드 포팅하는 neuron-framework-autoport와 포팅된 모델의 수치적 동등성을 검증하는 neuron-framework-equivalence, 2가지 새로운 기능이 추가되었습니다. 기본적으로 둘 다 이제 모든 Neuron DLAMI와 딥 러닝 컨테이너에 포함됩니다. 이 릴리스에는 Kubernetes 동적 리소스 할당을 위한 Neuron DRA 드라이버도 도입되어 Elastic Fabric Adapter(EFA) 인터페이스와 Trainium 가속기의 토폴로지 인식 스케줄링이 가능해졌습니다. Neuron 그래프 컴파일러는 이제 컴파일 시간을 크게 단축했으며, Neuron 런타임은 기본적으로 제로 카피 호스트-디바이스 전송을 지원합니다.

AWS Neuron은 Amazon EC2 Trn1, Trn2, Inf2, Inf1 인스턴스가 제공되는 모든 AWS 리전에서 사용할 수 있습니다. 리전별 AWS PrivateLink 사용 가능 여부는 AWS 리전 표에서 자세히 알아볼 수 있습니다.

시작하려면 다음 리소스를 참조하세요.