Phiên bản P5en cho Amazon EC2 hiện được cung cấp ở Miền Đông Hoa Kỳ (Bắc Virginia) và Châu Á Thái Bình Dương (Jakarta)

Ngày đăng: 27 Th03 2025

Kể từ hôm nay, phiên bản P5en sử dụng GPU NVIDIA H200 cho Amazon Elastic Compute Cloud (Amazon EC2) được cung cấp ở các khu vực Miền Đông Hoa Kỳ (Bắc Virginia) và Châu Á Thái Bình Dương (Jakarta). Phiên bản này được tối ưu hóa cho các ứng dụng AI tạo sinh và điện toán hiệu năng cao (HPC).

Phiên bản P5en sử dụng 8 GPU H200, có dung lượng bộ nhớ GPU cao gấp 1,7 lần và băng thông bộ nhớ GPU cao gấp 1,4 lần so với GPU H100 của phiên bản P5. Phiên bản P5en kết hợp với GPU H200 có bộ xử lý Intel Xeon Scalable thế hệ 4 tùy chỉnh và hiệu năng cao, cho phép kết nối PCIe Gen5 giữa CPU và GPU, giúp cung cấp băng thông giữa CPU và GPU cao hơn gấp 4 lần, đồng thời tăng hiệu suất đào tạo và suy luận AI. P5en (có tới 3200 Gbps EFA thế hệ thứ 3 và sử dụng Nitro v5) đã cải thiện độ trễ tới 35% so với P5 sử dụng thế hệ trước của EFA và Nitro. Điều này giúp cải thiện hiệu năng giao tiếp tập thể cho khối lượng công việc đào tạo phân tán như ứng dụng học sâu, AI tạo sinh, xử lý dữ liệu theo thời gian thực và điện toán hiệu năng cao (HPC). Để giải quyết nhu cầu về quy mô lớn với độ trễ thấp của khách hàng, chúng tôi đã triển khai phiên bản P5en trong Amazon EC2 UltraClusters để cung cấp khả năng tăng quy mô hàng đầu thị trường cho khối lượng công việc đào tạo phân tán và khối lượng công việc HPC được liên kết chặt chẽ.

Với sự bổ sung này, phiên bản P5en hiện được cung cấp ở các Khu vực AWS: Miền Đông Hoa Kỳ (Bắc Virginia, Ohio), Miền Tây Hoa Kỳ (Oregon), Châu Âu (Tây Ban Nha) và Châu Á Thái Bình Dương (Jakarta, Mumbai, Seoul, Tokyo và Seoul); p5en.48xlarge được cung cấp ở Vùng địa phương Miền Đông Hoa Kỳ (Atlanta) us-east-1-atl-2a.

Để tìm hiểu thêm về phiên bản P5en, hãy xem Phiên bản P5en cho Amazon EC2.