Phiên bản P5 một GPU cho Amazon EC2 hiện được cung cấp rộng rãi
Hôm nay, AWS công bố kích thước phiên bản P5 mới cho Amazon Elastic Compute Cloud (Amazon EC2) với một GPU NVIDIA H100, cho phép các doanh nghiệp điều chỉnh kích thước phù hợp với tài nguyên máy học (ML) và điện toán hiệu năng cao (HPC) một cách tiết kiệm chi phí.
Kích thước phiên bản mới cho phép khách hàng bắt đầu với quy mô nhỏ và tăng quy mô dần theo từng bước nhỏ, cung cấp khả năng kiểm soát chi phí cơ sở hạ tầng linh hoạt hơn. Khách hàng phát triển các mô hình ngôn ngữ lớn (LLM) vừa và nhỏ như chatbot hoặc các công cụ dịch ngôn ngữ chuyên dụng giờ đây có thể chạy các tác vụ suy luận một cách tiết kiệm hơn. Khách hàng cũng có thể sử dụng các phiên bản này để triển khai các ứng dụng HPC nhằm khám phá dược phẩm, phân tích dòng chất lưu và lập mô hình tài chính mà không cần cam kết triển khai GPU quy mô lớn, tốn kém.
Các phiên bản P5.4xlarge hiện được cung cấp thông qua Khối dung lượng Amazon EC2 cho ML ở các Khu vực AWS sau: Miền Đông Hoa Kỳ (Bắc Virginia, Ohio), Miền Tây Hoa Kỳ (Oregon), Châu Âu (London), Châu Á Thái Bình Dương (Mumbai, Sydney, Tokyo) và Nam Mỹ (Sao Paulo). Bạn có thể mua các phiên bản này Theo nhu cầu, Dùng ngay hoặc thông qua Gói tiết kiệm ở các khu vực Châu Âu (London), Châu Á Thái Bình Dương (Mumbai, Jakarta, Tokyo) và Nam Mỹ (Sao Paulo).
Để tìm hiểu thêm về phiên bản P5.4xlarge, hãy truy cập phiên bản P5 cho Amazon EC2.