Phiên bản P5 cho Amazon EC2 hiện được cung cấp trong đám mây bí mật AWS

Ngày đăng: 15 Th08 2024

Phiên bản P5 của Amazon Elastic Compute Cloud (Amazon EC2) dựa trên GPU NVIDIA H100 Tensor Core đã được cung cấp trong đám mây bí mật AWS. Các phiên bản P5 cho Amazon EC2 giúp bạn tăng tốc đến 4 lần thời gian đưa ra giải pháp so với các phiên bản EC2 dựa trên GPU thế hệ trước và giảm tới 40% chi phí đào tạo các mô hình máy học.

Bạn có thể sử dụng các phiên bản P5e để đào tạo và triển khai các mô hình ngôn ngữ lớn (LLM) ngày càng phức tạp và các mô hình khuếch tán hỗ trợ cho các ứng dụng AI tạo sinh có đòi hỏi khắt khe nhất. Trong đó bao gồm trả lời câu hỏi, tạo mã, tạo video và hình ảnh, nhận dạng giọng nói, v.v. Bạn cũng có thể sử dụng phiên bản P5 để triển khai các ứng dụng HPC có đòi hỏi khắt khe ở quy mô lớn để tìm hiểu về dược phẩm, phân tích địa chấn, dự báo thời tiết và lập mô hình tài chính.

Phiên bản P5 được cung cấp bởi GPU NVIDIA H100 Tensor Core mới nhất và cung cấp hiệu năng CPU cao hơn gấp 2 lần, bộ nhớ hệ thống cao hơn 2 lần và bộ nhớ cục bộ cao hơn gấp 4 lần so với các phiên bản dựa trên GPU thế hệ trước. Các phiên bản này đem lại khả năng điều chỉnh quy mô hàng đầu thị trường cho các khối lượng công việc đào tạo phân tán và HPC được liên kết chặt chẽ, với khả năng kết nối mạng lên đến 3.200 Gbps sử dụng công nghệ Trình chuyển cấu trúc linh hoạt (EFA) thế hệ thứ hai. 

Nội dung trong bài đăng này chỉ nhằm mục đích cung cấp thông tin. Để biết thêm thông tin về phiên bản P5 cho Amazon EC2 trong đám mây bí mật AWS, vui lòng liên hệ với chúng tôi.