Phiên bản Amazon EC2 P5en hiện được cung cấp ở Khu vực AWS Miền Tây Hoa Kỳ (Bắc California)
Kể từ hôm nay, phiên bản Amazon Elastic Compute Cloud (Amazon EC2) P5en sử dụng GPU NVIDIA H200 sẽ được cung cấp ở Khu vực AWS Miền Tây Hoa Kỳ (Bắc California). Phiên bản này được tối ưu hóa cho các ứng dụng AI tạo sinh và điện toán hiệu năng cao (HPC).
Phiên bản P5en sử dụng 8 GPU H200, có dung lượng bộ nhớ GPU cao gấp 1,7 lần và băng thông bộ nhớ GPU cao gấp 1,4 lần so với GPU H100 của phiên bản P5. Phiên bản P5en kết hợp với GPU H200 có bộ xử lý Intel Xeon Scalable thế hệ 4 tùy chỉnh và hiệu năng cao, cho phép kết nối PCIe Gen5 giữa CPU và GPU, giúp cung cấp băng thông giữa CPU và GPU cao hơn gấp 4 lần, đồng thời tăng hiệu suất đào tạo và suy luận AI. P5en (có tới 3200 Gbps EFA thế hệ thứ 3 và sử dụng Nitro v5) đã cải thiện độ trễ tới 35% so với P5 sử dụng thế hệ trước của EFA và Nitro. Điều này giúp cải thiện hiệu năng giao tiếp tập thể cho khối lượng công việc đào tạo phân tán như ứng dụng học sâu, AI tạo sinh, xử lý dữ liệu theo thời gian thực và điện toán hiệu năng cao (HPC). Để giải quyết nhu cầu về quy mô lớn với độ trễ thấp của khách hàng, chúng tôi đã triển khai phiên bản P5en trong Amazon EC2 UltraClusters để cung cấp khả năng tăng quy mô hàng đầu thị trường cho khối lượng công việc đào tạo phân tán và khối lượng công việc HPC được liên kết chặt chẽ.
Để tìm hiểu thêm về phiên bản P5en, hãy xem Phiên bản P5en cho Amazon EC2.