Công bố AWS Neuron SDK 2.25.0
Hôm nay, AWS công bố việc cung cấp rộng rãi Neuron SDK 2.25.0, mang lại các cải tiến cho khối lượng công việc suy luận và giám sát hiệu năng trên các phiên bản AWS Inferentia và Trainium. Bản phát hành mới nhất này bổ sung hỗ trợ song song ngữ cảnh và dữ liệu cũng như thu hút sự chú ý đối với quá trình xử lý trình tự dài trong suy luận, đồng thời cập nhật API neuron-ls và neuron-monitor với nhiều thông tin hơn về khả năng bố trí nút và việc sử dụng thiết bị, theo thứ tự tương ứng.
Bản phát hành này cũng giới thiệu bí danh tự động (Beta) cho các hoạt động tensor nhanh và bổ sung các cải tiến cho việc phục vụ phân tách (Beta). Cuối cùng, nó cung cấp các AMI được nâng cấp và Bộ chứa học sâu để suy luận và đào tạo khối lượng công việc trên Neuron.
Neuron 2.25.0 được cung cấp ở tất cả các Khu vực AWS cung cấp phiên bản Inferentia và Trainium.
Để tìm hiểu thêm và xem danh sách đầy đủ các tính năng và cải tiến mới, hãy xem: