Phiên bản G6e của Amazon EC2 hiện đã được cung cấp ở những khu vực khác

Ngày đăng: 21 Th11 2024

Kể từ hôm nay, phiên bản G6e của Amazon EC2 chạy bằng GPU NVIDIA L40S Tensor Core sẽ được hỗ trợ tại khu vực Châu Á Thái Bình Dương (Tokyo) và Châu Âu (Frankfurt, Tây Ban Nha). Các phiên bản G6e có thể được sử dụng cho nhiều trường hợp sử dụng công nghệ máy học và dịch vụ điện toán không gian khác nhau. Phiên bản G6e mang đến hiệu năng cao hơn tới 2,5 lần so với phiên bản G5 và chi phí suy luận thấp hơn tới 20% so với phiên bản P4d.

Khách hàng có thể sử dụng phiên bản G6e để triển khai các mô hình ngôn ngữ lớn (LLM) với các tham số lên đến 13B và mô hình khuếch tán để tạo hình ảnh, video và âm thanh. Ngoài ra, các phiên bản G6e sẽ khai phá khả năng của khách hàng để tạo ra các mô phỏng 3D và bản sao kỹ thuật số lớn hơn, chân thực hơn cho khối lượng công việc điện toán không gian. Phiên bản G6e được trang bị tối đa 8 GPU NVIDIA L40S Tensor Core với tổng bộ nhớ GPU 384 GB (48 GB bộ nhớ cho mỗi GPU) và bộ xử lý AMD EPYC thế hệ thứ ba. Phiên bản G6e cũng hỗ trợ lên đến 192 vCPU, băng thông mạng lên đến 400 Gbps, bộ nhớ hệ thống lên đến 1,536 TB và dung lượng lưu trữ SSD NVMe cục bộ lên đến 7,6 TB. Các nhà phát triển có thể vận hành khối lượng công việc suy luận AI trên phiên bản G6e bằng AMI học sâu của AWS, Bộ chứa học sâu của AWS hoặc các dịch vụ được quản lý như Dịch vụ Kubernetes linh hoạt Amazon (Amazon EKS) và Lô AWS, với sự hỗ trợ của Amazon SageMaker sắp ra mắt.

Phiên bản G6e của Amazon EC2 hiện đã được cung cấp ở các khu vực AWS Miền Đông Hoa Kỳ (Bắc Virginia, Ohio), Miền Tây Hoa Kỳ (Oregon), Châu Á Thái Bình Dương (Tokyo) và Châu Âu (Frankfurt, Tây Ban Nha). Khách hàng có thể mua phiên bản G6e dưới dạng Phiên bản theo nhu cầu, Phiên bản đặt trước, Phiên bản dùng ngay hoặc như một phần của Gói tiết kiệm.

Để bắt đầu, hãy truy cập Bảng điều khiển quản lý AWS, Giao diện dòng lệnh (CLI) AWS và SDK AWS. Để tìm hiểu thêm, hãy truy cập trang phiên bản G6e.