Tính năng chia nhỏ thời gian NVIDIA GPU hiện đã được áp dụng cho Bottlerocket để giúp cải thiện khối lượng công việc AI/ML

Ngày đăng: 23 Th10 2024

Hôm nay, AWS xin công bố hỗ trợ tính năng chia nhỏ thời gian NVIDIA GPU cho Bottlerocket, hệ điều hành dựa trên Linux được thiết kế riêng để lưu trữ bộ chứa, giúp cải thiện mức độ bảo mật, giảm thiểu mức chiếm dụng và hỗ trợ cập nhật an toàn. Tính năng mới này giải quyết thách thức về việc tối đa hóa mức sử dụng GPU trong môi trường nhiều đối tượng thuê và hạn chế về tài nguyên bằng cách cho phép chia sẻ tài nguyên GPU hiệu quả hơn cho các khối lượng công việc Trí tuệ nhân tạo/Máy học (AI/ML) chạy trên bộ chứa.

Bằng cách chia thời gian xử lý của GPU thành các khoảng thời gian nhỏ hơn (hay còn gọi là “lát cắt”), với việc hỗ trợ tính năng chia nhỏ thời gian, Bottlerocket đã cho phép nhiều tác vụ truy cập đồng thời vào cùng một GPU. Khả năng này cho phép khách hàng của Bottlerocket chạy nhiều mô hình AI/ML trên một GPU, giúp cải thiện mức sử dụng GPU và điều chỉnh quy mô khối lượng công việc hiệu quả hơn.

Tính năng chia nhỏ thời gian sử dụng GPU trên Bottlerocket hiện đã được cung cấp ở tất cả các khu vực thương mại và khu vực AWS GovCloud (Hoa Kỳ). Để tìm hiểu thêm về tính năng chia nhỏ thời gian sử dụng GPU của Bottlerocket, vui lòng truy cập trang web dành cho nhà phát triển của Bottlerocket.