AWS Neuron SDK 2.25.0 출시

게시된 날짜: 2025년 8월 21일

오늘 AWS는 Neuron SDK 2.25.0의 정식 버전을 발표했습니다. 이번 버전은 AWS Inferentia 및 Trainium 인스턴스에서 추론 워크로드와 성능 모니터링을 개선합니다. 이번 최신 릴리스에서는 컨텍스트 및 데이터 병렬 처리 지원과 추론 시 긴 시퀀스 처리를 위한 청크 어텐션이 추가되었으며, neuron-ls API와 neuron-monitor API가 각각 노드 친화성 및 디바이스 사용률에 대한 더 많은 정보를 제공하도록 업데이트되었습니다.

또한 이번 릴리스에서는 빠른 텐서 연산을 위한 자동 별칭 기능(베타)이 도입되었고, 분산 서빙 기능(베타)도 개선되었습니다. 마지막으로, Neuron에서 추론 및 훈련 워크로드를 지원하는 업그레이드된 AMI와 딥 러닝 컨테이너도 제공됩니다.

Neuron 2.25.0은 Inferentia 및 Trainium 인스턴스가 제공되는 모든 AWS 리전에서 사용할 수 있습니다.

자세한 내용을 알아보고 새로운 기능 및 개선 사항의 전체 목록을 확인하려면 다음을 참조하세요.