Tại sao nên chọn phiên bản P3 cho Amazon EC2?
Phiên bản Amazon EC2 P3 đem đến điện toán hiệu năng cao trên đám mây với tối đa 8 GPU nhân xử lý NVIDIA® V100 Tensor và tối đa 100 Gbps thông lượng kết nối mạng cho machine learning và các ứng dụng HPC. Các phiên bản này đem đến tối đa một petaflop hiệu năng chính xác hỗn hợp cho mỗi phiên bản để tăng tốc đáng kể khả năng machine learning và các ứng dụng điện toán hiệu năng cao. Các phiên bản Amazon EC2 P3 đã được chứng minh có khả năng giảm thời gian huấn luyện machine learning từ nhiều ngày xuống chỉ còn vài phút cũng như tăng thêm 3-4 lần số lượng mô phỏng được thực hiện cho điện toán hiệu năng cao.
Với băng thông mạng của phiên bản P3.16xlarge cao hơn tới 4 lần, phiên bản P3dn.24xlarge của Amazon EC2 là sự bổ sung mới nhất cho dòng phiên bản P3, được tối ưu hóa cho máy học phân tán và các ứng dụng HPC. Các phiên bản này cung cấp thông lượng kết nối mạng lên tới 100 Gbps, 96 vCPU Intel® Xeon® Scalable (Skylake) tùy chỉnh, 8 GPU nhân xử lý NVIDIA® V100 Tensor với 32 GB bộ nhớ mỗi GPU và 1,8 TB dung lượng lưu trữ cục bộ SSD trên NVMe. Các phiên bản P3dn.24xlarge cũng hỗ trợ Trình chuyển cấu trúc linh hoạt (EFA), giúp tăng tốc các ứng dụng máy học phân tán sử dụng Thư viện giao tiếp chung NVIDIA (NCCL). EFA có thể mở rộng quy mô lên đến hàng nghìn GPU, cải thiện đáng kể thông lượng và khả năng mở rộng của các mô hình đào tạo deep learning, từ đó cho kết quả nhanh hơn.
Tổng quan về phiên bản P3 cho Amazon EC2
Lợi ích
Chứng thực từ khách hàng
Dưới đây là một số ví dụ về cách khách hàng và đối tác đạt được mục tiêu kinh doanh của mình với các phiên bản P3 cho Amazon EC2.
-
Airbnb
Airbnb đang sử dụng machine learning để tối ưu hóa các đề xuất tìm kiếm và cải thiện hướng dẫn định giá động cho máy chủ, cả hai đều giúp gia tăng tỉ lệ thực hiện đặt phòng. Với các phiên bản Amazon EC2 P3, Airbnb có thể chạy các khối lượng công việc đào tạo nhanh hơn, thực hiện nhiều lần lặp hơn, xây dựng các mô hình máy học tốt hơn và giúp giảm chi phí.
-
Celgene
Celgene là một công ty công nghệ sinh học toàn cầu, hiện đang phát triển các liệu pháp nhắm đích để đưa ra biện pháp điều trị phù hợp với bệnh nhân. Công ty này chạy khối lượng công việc HPC cho các mô phỏng hóa học và quá trình giải trình tự gen thế hệ mới trên các phiên bản Amazon EC2 P3. Với công suất điện toán này, Celgene có thể đào tạo các mô hình deep learning để phân biệt tế bào ác tính với tế bào lành tính. Trước khi sử dụng các phiên bản P3, công ty này mất hai tháng để chạy các tác vụ điện toán quy mô lớn, giờ đây họ chỉ mất bốn giờ. Công nghệ AWS đã cho phép Celgene đẩy nhanh quá trình phát triển các liệu pháp thuốc cho bệnh ung thư và các bệnh viêm nhiễm.
-
Hyperconnect
Hyperconnect chuyên áp dụng các công nghệ mới dựa trên máy học để xử lý hình ảnh và video. Đây còn là công ty đầu tiên phát triển công nghệ webRTC cho nền tảng di động.
-
NerdWallet
NerdWallet là một công ty khởi nghiệp về tài chính cá nhân, chuyên cung cấp các công cụ và lời khuyên giúp khách hàng dễ dàng trả nợ, lựa chọn các sản phẩm và dịch vụ tài chính tốt nhất, cũng như giải quyết các mục tiêu lớn trong đời như mua nhà hoặc tiết kiệm để chuẩn bị nghỉ hưu. Công ty phụ thuộc rất nhiều vào khoa học dữ liệu và máy học (ML) để kết nối khách hàng với các sản phẩm tài chính được cá nhân hóa.
-
PathWise Solutions Group
Đi đầu trong các giải pháp hệ thống chất lượng, PathWise của Aon là bộ ứng dụng SaaS dựa trên đám mây hướng đến mô hình quản lý rủi ro dành cho doanh nghiệp. Bộ ứng dụng này cung cấp tốc độ, sự tin cậy, tính bảo mật và dịch vụ theo nhu cầu cho một loạt khách hàng.
-
Pinterest
Pinterest sử dụng phương thức đào tạo độ chính xác kết hợp trong các phiên bản P3 trên AWS để đẩy nhanh quá trình đào tạo các mô hình deep learning, đồng thời dùng các phiên bản P3 để suy luận các mô hình này nhanh hơn, nhằm đem lại cho người dùng trải nghiệm khám phá nhanh và độc đáo. Pinterest sử dụng PinSage, công cụ được tạo ra bằng cách sử dụng PyTorch trên AWS. Mô hình AI này nhóm các hình ảnh với nhau dựa trên một số chủ đề nhất định. Với 3 tỷ hình ảnh trên nền tảng, có 18 tỷ mối liên hệ khác nhau kết nối các hình ảnh. Những mối liên hệ này giúp Pinterest ngữ cảnh hóa các chủ đề, phong cách và đem lại trải nghiệm phù hợp hơn với từng người dùng.
-
Salesforce
Salesforce đang sử dụng machine learning để hỗ trợ Einstein Vision, cho phép các nhà phát triển khai thác sức mạnh của nhận dạng hình ảnh đối với các trường hợp sử dụng như tìm kiếm hình ảnh, phát hiện thương hiệu và nhận dạng sản phẩm. Các phiên bản Amazon EC2 P3 cho phép nhà phát triển đào tạo các mô hình deep learning nhanh hơn hẳn, nhờ đó rút ngắn thời gian đạt được mục tiêu máy học.
-
Schrodinger
Schrodinger sử dụng điện toán hiệu năng cao (HPC) để phát triển các mô hình dự đoán nhằm mở rộng quy mô phát hiện và tối ưu hóa, đồng thời cung cấp cho khách hàng khả năng đưa các loại thuốc cứu sinh ra thị trường nhanh hơn. Các phiên bản Amazon EC2 P3 cho phép Schrodinger thực hiện số mô phỏng trong một ngày gấp bốn lần so với khi sử dụng phiên bản P2.
-
Subtle Medical
Subtle Medical là một công ty công nghệ về chăm sóc sức khỏe, hoạt động với mục đích nâng cao hiệu quả hình ảnh y khoa và trải nghiệm của bệnh nhân bằng giải pháp deep learning đổi mới. Đội ngũ của công ty bao gồm các nhà khoa học về hình ảnh, bác sĩ X quang và chuyên gia AI nổi tiếng từ Standford, MIT, MD Anderson và nhiều tổ chức khác.
-
Western Digital
Western Digital sử dụng HPC để chạy hàng chục nghìn mô phỏng cho khoa học vật liệu, luồng nhiệt, từ tính và truyền dữ liệu để cải thiện chất lượng cũng như hiệu năng của giải pháp lưu trữ và ổ đĩa. Dựa trên quá trình kiểm thử ban đầu, các phiên bản P3 cho phép các đội ngũ kỹ thuật chạy mô phỏng nhanh hơn ít nhất ba lần so với các giải pháp đã triển khai trước đó.
Phiên bản P3 cho Amazon EC2 và Amazon SageMaker
Phiên bản P3 cho Amazon EC2 và AMI học sâu của AWS
Môi trường phát triển được cấu hình sẵn để nhanh chóng bắt đầu xây dựng các ứng dụng học sâu
Một giải pháp thay thế cho Amazon SageMaker dành cho các nhà phát triển có yêu cầu tùy biến cao hơn, AMI học sâu của AWS cung cấp cho những người thực hành máy học và các nhà nghiên cứu cơ sở hạ tầng và các công cụ để tăng tốc học sâu trong đám mây ở mọi quy mô. Bạn có thể nhanh chóng khởi chạy các phiên bản Amazon EC2 P3 được cài đặt sẵn với các framework về học sâu phổ biến như TensorFlow, PyTorch, Apache MXNet, Microsoft Cognitive Toolkit, Caffe, Caffe2, Theano, Torch, Chainer, Gluon và Keras để đào tạo các mô hình AI tùy biến phức tạp, thử nghiệm thuật toán mới hoặc tìm hiểu kỹ năng và kỹ thuật mới. Tìm hiểu thêm
Phiên bản P3 cho Amazon EC2 và điện toán hiệu năng cao
Giải quyết các vấn đề điện toán lớn và thu thập thông tin chuyên sâu mới bằng cách tận dụng sức mạnh của HPC trên AWS
Các phiên bản Amazon EC2 P3 là nền tảng lý tưởng để chạy các mô phỏng kỹ thuật, điện toán tài chính, phân tích địa chấn, dựng mô hình phân tử, nghiên cứu gen và chức năng gen, phối cảnh và các khối lượng công việc điện toán GPU khác. Điện toán hiệu năng cao (HPC) cho phép các nhà khoa học và kỹ sư giải quyết các vấn đề phức tạp, tốn nhiều tài nguyên điện toán này. Các ứng dụng HPC thường yêu cầu hiệu năng mạng cao, lưu trữ nhanh, dung lượng bộ nhớ lớn, khả năng điện toán cao hoặc tất cả các yếu tố kể trên. AWS cho phép bạn tăng tốc độ nghiên cứu và rút ngắn thời gian nhận được kết quả bằng cách chạy HPC trên đám mây và thay đổi quy mô để số lượng các tác vụ chạy song song nhiều hơn so với thực tế trong hầu hết các môi trường tại chỗ. Ví dụ: phiên bản P3dn.24xlarge hỗ trợ Elastic Fabric Adapter (EFA) cho phép các ứng dụng HPC sử dụng Giao diện trao đổi thông điệp (MPI) để mở rộng quy mô lên đến hàng nghìn GPU. AWS giúp giảm chi phí bằng cách cung cấp các giải pháp được tối ưu hóa cho những ứng dụng cụ thể và không cần vốn đầu tư lớn. Tìm hiểu thêm
Hỗ trợ NVIDIA RTX Virtual Workstation
Các AMI NVIDIA RTX Virtual Workstation cung cấp hiệu năng đồ họa cao bằng cách sử dụng phiên bản P3 mạnh mẽ kết hợp với các GPU NVIDIA Volta V100 chạy trong đám mây AWS. Các AMI này được cài sẵn phần mềm đồ họa GPU NVIDIA mới nhất cùng với trình điều khiển RTX mới nhất và chứng nhận NVIDIA ISV hỗ trợ lên tới bốn độ phân giải màn hình 4K. Các phiên bản P3 có các GPU NVIDIA V100 kết hợp với RTX vWS cung cấp máy trạm có hiệu năng cao trong đám mây với bộ nhớ GPU lên tới 32 GiB, công nghệ dò tia (ray tracing) nhanh và dựng hình sử dụng trí tuệ nhân tạo.
Các AMI mới đã có mặt trên AWS Marketplace, hỗ trợ Windows Server 2016 và Windows Server 2019.
Phiên bản Amazon EC2 P3dn.24xlarge
Chi tiết sản phẩm phiên bản Amazon EC2 P3
Kích cỡ phiên bản | GPU - Tesla V100 | GPU Peer to Peer | Bộ nhớ GPU (GB) | vCPU | Bộ nhớ (GB) | Băng thông mạng | Băng thông EBS | Giá theo yêu cầu/giờ* | Giá thực tế theo giờ của phiên bản dự trữ 1 năm* | Giá thực tế theo giờ của phiên bản dự trữ 3 năm* |
---|---|---|---|---|---|---|---|---|---|---|
p3.2xlarge | 1 | Không áp dụng | 16 | 8 | 61 | Lên đến 10 Gbps | 1.5 Gbps | 3.06 USD | 1.99 USD | 1.05 USD |
p3.8xlarge | 4 |
NVLink | 64 | 32 | 244 | 10 Gbps | 7 Gbps | 12.24 USD | 7.96 USD | 4.19 USD |
p3.16xlarge | 8 | NVLink | 128 | 64 | 488 | 25 Gbps | 14 Gbps | 24.48 USD | 15.91 USD | 8.39 USD |
p3dn.24xlarge | 8 | NVLink | 256 | 96 | 768 | 100 Gbps | 19 Gbps | 31,218 USD | 18.30 USD | 9.64 USD |
* - Giá hiển thị là dành cho Linux/Unix ở Khu vực AWS Miền Đông Hoa Kỳ (Phía Bắc Virginia) và được làm tròn đến cent nhỏ nhất. Để xem đầy đủ thông tin chi tiết về giá, hãy xem trang về giá của Amazon EC2.
Khách hàng có thể mua các phiên bản P3 dưới dạng Phiên bản theo nhu cầu, Phiên bản dự trữ, Phiên bản Spot và Máy chủ chuyên dụng.
Tính tiền theo giây
Một trong nhiều ưu điểm của điện toán đám mây là bản chất co giãn của việc cung cấp hoặc ngừng cung cấp tài nguyên khi bạn cần chúng. Bằng cách sử dụng thanh toán xuống đến mức giây, chúng tôi cho phép khách hàng tăng mức độ co giãn, tiết kiệm tiền và cho phép họ tối ưu hóa phân bổ nguồn lực để đạt được các mục tiêu machine learning của mình.
Giá Phiên bản dự trữ
Phiên bản dự trữ đưa ra mức chiết khấu đáng kể (lên đến 75%) so với giá Phiên bản theo nhu cầu. Bên cạnh đó, khi Phiên bản dự trữ được chỉ định cho một Vùng sẵn sàng cụ thể, các Phiên bản dự trữ sẽ cung cấp một dự trữ công suất, giúp bạn thêm tự tin vào khả năng khởi chạy các phiên bản khi cần.
Giá Spot
Với Phiên bản Spot, bạn thanh toán giá Spot theo khoảng thời gian các phiên bản của bạn chạy. Giá phiên bản Spot là giá do Amazon EC2 ấn định và được điều chỉnh dần theo các xu hướng dài hạn về năng lực cung cầu đối với Phiên bản Spot. Phiên bản Spot được giảm giá tới 90% so với giá của phiên bản Theo nhu cầu.
Khả năng sử dụng trên toàn cầu
Các phiên bản P3.2xlarge, P3.8xlarge và P3.16xlarge của Amazon EC2 được cung cấp ở 14 Khu vực AWS để khách hàng có thể linh hoạt đào tạo và triển khai các mô hình machine learning của họ tại bất cứ nơi nào dữ liệu của họ được lưu trữ. P3 được cung cấp tại các khu vực AWS Miền Đông Hoa Kỳ (Bắc Virginia), Miền Đông Hoa Kỳ (Ohio), Miền Tây Hoa Kỳ (Oregon), Canada (Miền Trung), Châu Âu (Ai-len), Châu Âu (Frankfurt), Châu Âu (London), Châu Á Thái Bình Dương (Tokyo), Châu Á Thái Bình Dương (Seoul), Châu Á Thái Bình Dương (Sydney), Châu Á Thái Bình Dương (Singapore), Trung Quốc (Bắc Kinh), Trung Quốc (Ninh Hạ) và GovCloud (Miền Tây Hoa Kỳ).
Phiên bản P3dn.24xlarge được cung cấp ở khu vực AWS Châu Á Thái Bình Dương (Tokyo), Châu Âu (Ireland), Miền Đông Hoa Kỳ (Bắc Virginia), Miền Tây Hoa Kỳ (Oregon), GovCloud (Miền Tây Hoa Kỳ) và GovCloud (Miền Đông Hoa Kỳ).
Bắt đầu với các phiên bản Amazon EC2 P3 cho machine learning
Để bắt đầu chỉ trong vài phút, hãy tìm hiểu thêm về Amazon SageMaker hoặc sử dụng AMI học sâu của AWS, được cài đặt sẵn với các khung học sâu phổ biến như Caffe2 và MXNet. Ngoài ra, bạn cũng có thể sử dụng AMI NVIDIA với trình điều khiển GPU và bộ công cụ CUDA được cài đặt sẵn.