Chúng tôi đã cung cấp rộng rãi phiên bản P5en cho Amazon EC2 được tối ưu hóa cho HPC và AI tạo sinh
Hôm nay, AWS thông báo cung cấp rộng rãi các phiên bản P5en của Amazon Elastic Compute Cloud (Amazon EC2) sử dụng GPU Tensor Core NVIDIA H200 mới nhất. Phiên bản này cung cấp hiệu năng cao nhất trong Amazon EC2, phục vụ cho các ứng dụng học sâu và điện toán hiệu năng cao (HPC).
Bạn có thể sử dụng phiên bản P5en của Amazon EC2 để đào tạo và triển khai các mô hình ngôn ngữ lớn (LLM) ngày càng phức tạp và mô hình khuếch tán hỗ trợ cho các ứng dụng AI tạo sinh có đòi hỏi khắt khe nhất. Bạn cũng có thể sử dụng phiên bản P5en để triển khai các ứng dụng HPC có nhu cầu cao ở quy mô lớn để tìm hiểu về dược phẩm, phân tích địa chấn, dự báo thời tiết và lập mô hình tài chính.
Phiên bản P5en sử dụng tới 8 GPU H200 có dung lượng bộ nhớ GPU cao gấp 1,7 lần và băng thông bộ nhớ GPU cao gấp 1,5 lần so với GPU H100 của phiên bản P5. Phiên bản P5en kết hợp với GPU H200 có bộ xử lý Intel Xeon Scalable thế hệ 4 tùy chỉnh và hiệu năng cao, cho phép kết nối PCIe Gen5 giữa CPU và GPU, giúp cung cấp băng thông giữa CPU và GPU cao hơn gấp 4 lần, đồng thời tăng hiệu suất đào tạo và suy luận AI. P5en (có tới 3200 Gbps EFA thế hệ thứ 3 và sử dụng Nitro v5) đã cải thiện độ trễ tới 35% so với P5 sử dụng thế hệ trước của EFA và Nitro. Điều này giúp cải thiện hiệu năng giao tiếp tập thể cho khối lượng công việc đào tạo phân tán như ứng dụng học sâu, AI tạo sinh, xử lý dữ liệu theo thời gian thực và điện toán hiệu năng cao (HPC). Để giải quyết nhu cầu về quy mô lớn với độ trễ thấp của khách hàng, chúng tôi đã triển khai phiên bản P5en trong Amazon EC2 UltraClusters để cung cấp khả năng tăng quy mô hàng đầu thị trường cho khối lượng công việc đào tạo phân tán và khối lượng công việc HPC được liên kết chặt chẽ.
Phiên bản P5en hiện được cung cấp ở các Khu vực AWS Miền Đông Hoa Kỳ (Ohio), Miền Tây Hoa Kỳ (Oregon), Châu Á Thái Bình Dương (Tokyo) và Miền Đông Hoa Kỳ (Atlanta) Vùng địa phương us-east-1-atl-2a ở kích thước p5en.48xlarge.
Để tìm hiểu thêm về phiên bản P5en, hãy xem Phiên bản P5en cho Amazon EC2.