P6e-GB200 UltraServers của Amazon hiện có sẵn cho hiệu năng GPU cao nhất trong EC2
Hôm nay, AWS công bố cung cấp rộng rãi P6e-GB200 UltraServers cho Amazon Elastic Compute Cloud (Amazon EC2), được tăng tốc bằng NVIDIA GB200 NVL72. P6e-GB200 UltraServers cho Amazon EC2 cung cấp hiệu năng đào tạo và suy luận AI dựa trên GPU cao nhất trong EC2. Các phiên bản này được thiết kế để tăng tốc đào tạo và suy luận cho mô hình nền tảng (FM) bao gồm các tính năng thế hệ mới như mô hình lập luận và AI trợ lý ảo trên quy mô hàng nghìn tỷ thông số.
Với P6e-GB200 UltraServers, khách hàng có thể truy cập tối đa 72 GPU Blackwell trong một miền NVLink để tận dụng 360 petaflop điện toán FP8 (không có độ thưa thớt), 13,4 TB tổng bộ nhớ băng thông cao (HBM3e) và mạng lưới Trình chuyển cấu trúc linh hoạt (EFAv4) lên đến 28,8 Tbps. P6e-GB200 UltraServers sử dụng AWS Nitro System, cho phép khách hàng điều chỉnh quy mô khối lượng công việc AI một cách đáng tin cậy và an toàn trong EC2 UltraClusters lên hàng chục nghìn GPU.
P6e-GB200 UltraServers hiện có sẵn thông qua Khối dung lượng Amazon EC2 cho ML trong Vùng địa phương Dallas (“us-east-1-dfw-2a”), phần mở rộng của khu vực Miền Đông Hoa Kỳ (Bắc Virginia). P6e-GB200 UltraServers có hai loại kích thước: u-p6e-gb200x72 (72 GPU trong NVLink) và u-p6e-gb200x36 (36 GPU trong NVLink).
Để tìm hiểu thêm, hãy xem các phiên bản P6e-GB200 UltraServers và P6-B200 cho Amazon EC2.