Phiên bản Amazon EC2 P3

Tăng tốc độ machine learning và các ứng dụng điện toán hiệu năng cao với GPU mạnh mẽ

Các công ty hàng đầu như Airbnb, Salesforce và Western Digital sử dụng các phiên bản Amazon EC2 P3 để sử dụng cho các ứng dụng điện toán hiệu năng cao và machine learning của họ.
Các phiên bản Amazon EC2 P3 thực hiện điện toán hiệu năng cao nhất trong đám mây, hiệu quả về chi phí, hỗ trợ tất cả các framework chính về machine learning và có mặt trên toàn cầu.
Được hỗ trợ bởi tám GPU NVIDIA Tesla V100 thế hệ mới nhất, các phiên bản Amazon EC2 P3 mang đến 1 petaflop hiệu năng chính xác hỗn hợp cho mỗi phiên bản để tăng tốc đáng kể khả năng machine learning và các ứng dụng điện toán hiệu năng cao. Các phiên bản Amazon EC2 P3 đã được chứng minh giúp giảm thời gian huấn luyện machine learning từ nhiều ngày chỉ còn vài phút cũng như rút ngắn thời gian nhận được kết quả đối với điện toán hiệu năng cao.

ReInvent_HA_P3_EDITORIAL
88% các dự án của TensorFlow trên đám mây đang chạy trên AWS.
Trong báo cáo này, Nucleus Research tiết lộ năm lý do vì sao những người thực hành với deep learning chọn AWS cho deep learning thay vì các nhà cung cấp đám mây khác.

XEM: Tìm hiểu thêm về các phiên bản Amazon EC2 P3 và xem cách Airbnb sử dụng cho các ứng dụng machine learning của họ (48:08 phút).
AWS re: Invent 2017: Giới thiệu phiên bản Amazon EC2 P3

Lợi ích

GIẢM THỜI GIAN HUẤN LUYỆN MACHINE LEARNING TỪ VÀI NGÀY XUỐNG CÒN VÀI PHÚT

Đối với các nhà khoa học dữ liệu, các nhà nghiên cứu và các nhà phát triển cần tăng tốc các ứng dụng ML, các phiên bản Amazon EC2 P3 chính là khả năng điện toán GPU mạnh mẽ nhất có mặt trên đám mây. Các phiên bản Amazon EC2 P3 được hỗ trợ đến tám GPU NVIDIA Tesla V100 thế hệ mới nhất và mang đến 1 petaflop hiệu năng chính xác hỗn hợp nhằm tăng tốc đáng kể khối lượng công việc ML. Huấn luyện mô hình nhanh hơn có thể giúp các nhà khoa học dữ liệu và các kỹ sư machine learning lặp lại nhanh hơn, huấn luyện nhiều mô hình hơn và gia tăng độ chính xác.

 

GIẢI PHÁP TIẾT KIỆM CHI PHÍ NHẤT TRONG NGÀNH

Các phiên bản Amazon EC2 P3 cung cấp các gói giá cả khác nhau giúp bạn tiết kiệm chi phí dựa trên nhu cầu của mình.  Ngoài các phiên bản Theo yêu cầu cần bạn thanh toán cho các phiên bản mà bạn khởi chạy, bạn còn có thể mua các Phiên bản dự trữ với mức chiết khấu cao, các phiên bản này luôn được cung cấp trong thời hạn từ một đến ba năm. Bạn cũng có thể sử dụng phiên bản Spot tận dụng các phiên bản EC2 chưa sử dụng, có thể giúp bạn giảm đáng kể chi phí cho Amazon EC2.

ĐIỆN TOÁN HIỆU NĂNG CAO ĐẦY MẠNH MẼ, LINH ĐỘNG

Không như các hệ thống tại chỗ, việc chạy điện toán hiệu năng cao trên các phiên bản Amazon EC2 P3 cung cấp dung lượng ảo không giới hạn giúp bạn thay đổi quy mô cơ sở hạ tầng và độ linh hoạt để thay đổi tài nguyên một cách dễ dàng và thường xuyên theo nhu cầu khối lượng công việc của bạn. Bạn có thể cấu hình tài nguyên của mình nhằm đáp ứng nhu cầu về ứng dụng và khởi chạy một cụm HPC trong vài phút, mà chỉ cần trả tiền cho những gì bạn sử dụng.

TÍCH HỢP CÁC DỊCH VỤ AWS MACHINE LEARNING

Các phiên bản Amazon EC2 P3 hoạt động liền mạch kết hợp cùng Amazon SageMaker để cung cấp nền tảng machine learning hoàn chỉnh và trực quan mạnh mẽ. Amazon SageMaker là một nền tảng machine learning được quản lý toàn phần cho phép bạn nhanh chóng và dễ dàng xây dựng, huấn luyện và triển khai các mô hình machine learning. Hơn nữa, các phiên bản Amazon EC2 P3 có thể được tích hợp với AWS Deep Learning Amazon Machine Images (AMI) đã cài đặt sẵn với các framework về deep learning phổ biến giúp dễ dàng bắt đầu với việc huấn luyện và suy luận.

HỖ TRỢ TẤT CẢ CÁC FRAMEWORK CHÍNH VỀ MACHINE LEARNING

Các phiên bản Amazon EC2 P3 hỗ trợ tất cả các framework chính về machine learning bao gồm TensorFlow, PyTorch, Apache MXNet, Caffe, Caffe2, Microsoft Cognitive Toolkit (CNTK), Chainer, Theano, Keras, Gluon và Torch. Người dùng có thể chọn framework hoạt động tốt nhất cho ứng dụng của họ.

Huấn luyện machine learning nhiều nút có khả năng thay đổi quy mô

Khách hàng có thể sử dụng nhiều phiên bản EC2 P3 để huấn luyện nhanh các mô hình machine learning. Một cụm lưu trữ và một cụm điện toán có thể được cấu hình sao cho cụm lưu trữ lưu các bộ dữ liệu huấn luyện và xác nhận và chịu trách nhiệm truyền dữ liệu đến cụm điện toán, trong khi cụm điện toán thực hiện các chuyển tiếp, phân phối dữ liệu trở lại và cập nhật trọng số.

Câu chuyện của khách hàng

200x100_AirBNB_Logo

Airbnb đang sử dụng machine learning để tối ưu hóa các đề xuất tìm kiếm và cải thiện hướng dẫn định giá động cho máy chủ, cả hai đều giúp gia tăng tỉ lệ thực hiện đặt phòng. Với các phiên bản Amazon EC2 P3, Airbnb có khả năng chạy các khối lượng công việc huấn luyện nhanh hơn, thực hiện nhiều lần lặp hơn, xây dựng các mô hình machine learning tốt hơn và giúp giảm chi phí.

salesforce_logo_200x100

Salesforce đang sử dụng machine learning để hỗ trợ Einstein Vision, cho phép các nhà phát triển khai thác sức mạnh của nhận dạng hình ảnh đối với các trường hợp sử dụng như tìm kiếm hình ảnh, phát hiện thương hiệu và nhận dạng sản phẩm. Các phiên bản Amazon EC2 P3 cho phép các nhà phát triển huấn luyện các mô hình deep learning nhanh hơn nhằm đạt được mục tiêu machine learning của mình một cách nhanh chóng.

western-digital_200x100

Western Digital sử dụng điện toán hiệu năng cao (HPC) để chạy hàng chục nghìn mô phỏng cho khoa học vật liệu, luồng nhiệt, từ tính và truyền dữ liệu để cải thiện chất lượng cũng như hiệu năng giải pháp lưu trữ và ổ đĩa. Dựa trên thử nghiệm ban đầu, các phiên bản Amazon EC2 P3 cho phép các nhóm kỹ thuật chạy mô phỏng nhanh hơn ít nhất ba lần so với các giải pháp đã triển khai trước đó  

schrodinger-200x100

Schrodinger sử dụng điện toán hiệu năng cao (HPC) để phát triển các mô hình dự đoán nhằm mở rộng quy mô phát hiện và tối ưu hóa và cung cấp cho khách hàng khả năng đưa các loại thuốc cứu tính mạng ra thị trường nhanh hơn. Các phiên bản Amazon EC2 P3 cho phép Schrodinger thực hiện số mô phỏng trong một ngày gấp bốn lần so với khi sử dụng phiên bản P2.  

Phiên bản Amazon EC2 P3 và Amazon SageMaker

Cách nhanh nhất để huấn luyện và chạy các mô hình machine learning

Amazon SageMaker là một dịch vụ được quản lý toàn phần nhằm xây dựng, huấn luyện và triển khai các mô hình machine learning. Khi được sử dụng cùng với các phiên bản Amazon EC2 P3, khách hàng có thể dễ dàng thay đổi quy mô đến hàng chục, hàng trăm hoặc hàng nghìn GPU để huấn luyện mô hình nhanh chóng ở mọi quy mô mà không cần lo lắng về việc thiết lập các cụm và đường dẫn dữ liệu. Bạn cũng có thể dễ dàng truy cập tài nguyên Amazon Virtual Private Cloud (VPC) để huấn luyện và xây dựng luồng công việc trong Amazon SageMaker. Với tính năng này, bạn có thể sử dụng các bộ chứa Amazon Simple Storage Service (S3) chỉ có thể truy cập thông qua VPC của bạn để lưu trữ dữ liệu huấn luyện cũng như lưu trữ và xây dựng các thành phẩm mô hình thu được từ quá trình huấn luyện. Ngoài S3, các mô hình có thể truy cập tất cả các tài nguyên AWS khác có trong VPC. Tìm hiểu thêm.

Xây dựng

Amazon SageMaker sẽ khiến việc xây dựng và chuẩn bị sẵn sàng các mô hình machine learning để huấn luyện trở nên dễ dàng bằng cách cung cấp mọi thứ bạn cần để nhanh chóng kết nối với dữ liệu huấn luyện của bạn, đồng thời chọn và tối ưu hóa thuật toán và framework tốt nhất cho ứng dụng của bạn. Amazon SageMaker gồm có các máy tính xách tay Jupyter có máy chủ lưu trữ giúp việc khám phá và trực quan hóa dữ liệu huấn luyện của bạn được lưu trữ trên Amazon S3 trở nên dễ dàng.  Bạn cũng có thể sử dụng phiên bản máy tính xách tay để viết mã tạo các công việc huấn luyện mô hình, triển khai các mô hình vào lưu trữ Amazon SageMaker và kiểm tra hoặc xác nhận các mô hình của bạn.

Huấn luyện

Bạn có thể bắt đầu huấn luyện mô hình của mình chỉ bằng một cú nhấp chuột trên bảng điều khiển hoặc chỉ bằng một lệnh gọi API đơn giản. Amazon SageMaker được cấu hình sẵn với các phiên bản mới nhất của TensorFlow và Apache MXNet, với sự hỗ trợ thư viện CUDA9 để đạt hiệu năng tối ưu với các GPU của NVIDIA. Ngoài ra, việc tối ưu hóa siêu tham số có thể tự động tinh chỉnh mô hình của bạn bằng cách điều chỉnh các kết hợp khác nhau một cách thông minh để nhanh chóng đạt được các dự đoán chính xác nhất. Đối với các nhu cầu quy mô lớn hơn, bạn có thể thay đổi quy mô đến hàng chục phiên bản để hỗ trợ xây dựng mô hình nhanh hơn.

Triển khai

Sau khi huấn luyện, bạn có thể triển khai mô hình vào các phiên bản EC2 tự động mở rộng trên nhiều vùng sẵn sàng chỉ với một cú nhấp chuột. Khi được sản xuất, Amazon SageMaker quản lý cơ sở hạ tầng điện toán thay bạn để thực hiện kiểm tra tình trạng, áp dụng các bản vá bảo mật và thực hiện bảo trì định kỳ khác, tất cả đều được tích hợp chức năng giám sát và ghi nhật ký Amazon CloudWatch.

 

Phiên bản Amazon EC2 P3 và AWS Deep Learning AMI

Môi trường phát triển được cấu hình sẵn để nhanh chóng bắt đầu xây dựng các ứng dụng deep learning

Một giải pháp thay thế cho Amazon SageMaker dành cho các nhà phát triển có yêu cầu tùy biến cao hơn, AWS Deep Learning AMI cung cấp cho những người thực hành machine learning và các nhà nghiên cứu cơ sở hạ tầng và các công cụ để tăng tốc deep learning trong đám mây ở mọi quy mô. Bạn sẽ có thể nhanh chóng khởi chạy các phiên bản Amazon EC2 P3 được cài đặt sẵn với các framework về deep learning phổ biến như TensorFlow, PyTorch, Apache MXNet, Microsoft Cognitive Toolkit, Caffe, Caffe2, Theano, Torch, Chainer, Gluon và Keras để huấn luyện các mô hình AI tùy biến phức tạp, thử nghiệm thuật toán mới hoặc tìm hiểu kỹ năng và kỹ thuật mới. Tìm hiểu thêm.

Phiên bản Amazon EC2 P3 và Điện toán hiệu năng cao

Giải quyết các vấn đề điện toán lớn và đạt được thông tin chuyên sâu mới bằng cách sử dụng HPC trên AWS

Các phiên bản Amazon EC2 P3 là nền tảng lý tưởng để chạy các mô phỏng kỹ thuật, điện toán tài chính, phân tích địa chấn, dựng mô hình phân tử, nghiên cứu gen và chức năng gen, phối cảnh và các khối lượng công việc điện toán GPU khác. Điện toán hiệu năng cao (HPC) cho phép các nhà khoa học và các kỹ sư giải quyết những vấn đề điện toán mang tính chuyên sâu, phức tạp. Các ứng dụng HPC thường yêu cầu hiệu năng mạng cao, lưu trữ nhanh, dung lượng bộ nhớ lớn, khả năng tính toán rất cao hoặc tất cả các yếu tố kể trên. AWS cho phép bạn tăng tốc độ nghiên cứu và rút ngắn thời gian nhận được kết quả bằng cách chạy HPC trên đám mây và thay đổi quy mô để số lượng các tác vụ chạy song song nhiều hơn so với thực tế trong hầu hết các môi trường tại chỗ. AWS giúp giảm chi phí bằng cách cung cấp các giải pháp được tối ưu hóa cho những ứng dụng cụ thể và không cần vốn đầu tư lớn. Tìm hiểu thêm.

Chi tiết sản phẩm Phiên bản Amazon EC2 P3

Kích cỡ phiên bản GPU - Tesla V100 GPU Peer to Peer Bộ nhớ GPU (GB) vCPU Bộ nhớ (GB) Băng thông mạng Băng thông EBS Giá theo yêu cầu/giờ* Giá thực tế theo giờ của phiên bản dự trữ 1 năm* Giá thực tế theo giờ của phiên bản dự trữ 3 năm*
p3.2xlarge 1 Không áp dụng 16 8 61 Lên đến 10 Gbps 1.5 Gbps

3.06 USD

1.99 USD

1.23 USD

p3.8xlarge 4 NVLink 64 32 244 10 Gbps 7 Gbps

12.24 USD

7.96 USD

4.93 USD

p3.16xlarge 8 NVLink 128 64 488 25 Gbps 14 Gbps

24.48 USD

15.91 USD

9.87 USD

*Giá trình bày ở trên áp dụng cho Linux/Unix tại Khu vực AWS Miền Đông Hoa Kỳ (Bắc Virginia). Để xem đầy đủ thông tin chi tiết về giá, hãy xem trang về giá của Amazon EC2

Khách hàng có thể mua các phiên bản P3 dưới dạng các phiên bản theo yêu cầu, các phiên bản dự trữ, các phiên bản spot và các máy chủ chuyên dụng.

TÍNH TIỀN THEO GIÂY

Một trong nhiều ưu điểm của điện toán đám mây là bản chất co giãn của việc cung cấp hoặc ngừng cung cấp tài nguyên khi bạn cần chúng. Bằng cách sử dụng thanh toán xuống đến mức giây, chúng tôi cho phép khách hàng tăng mức độ co giãn, tiết kiệm tiền và cho phép họ tối ưu hóa phân bổ nguồn lực để đạt được các mục tiêu machine learning của mình.

GIÁ PHIÊN BẢN DỰ TRỮ

Phiên bản dự trữ đưa ra mức chiết khấu đáng kể (lên đến 75%) so với giá Phiên bản theo yêu cầu. Bên cạnh đó, khi Phiên bản dự trữ được chỉ định cho một Vùng sẵn sàng cụ thể, các Phiên bản dự trữ sẽ cung cấp một dự trữ công suất, giúp bạn thêm tự tin vào khả năng khởi chạy các phiên bản khi cần.

GIÁ SPOT

Với phiên bản Spot, bạn thanh toán giá Spot theo khoảng thời gian các phiên bản của bạn chạy. Giá phiên bản Spot là giá do Amazon EC2 ấn định và được điều chỉnh dần theo các xu hướng dài hạn về năng lực cung cầu đối với phiên bản Spot. Phiên bản Spot được giảm giá lên tới 90% so với giá Theo yêu cầu.

Sử dụng trên khắp toàn cầu

1856-Updated Map Image-P3 Instances-transparentBG_1024x543

Các phiên bản Amazon EC2 P3 sử dụng được ở 14 khu vực AWS để khách hàng có thể linh hoạt huấn luyện và triển khai các mô hình machine learning của họ tại bất cứ nơi nào dữ liệu của họ được lưu trữ. Các khu vực sử dụng được EC2 P3 là các khu vực AWS Miền Đông Hoa Kỳ (Bắc Virginia), Miền Đông Hoa Kỳ (Ohio), Miền Tây Hoa Kỳ (Oregon), Canada (Miền Trung), Châu Âu (Ai-len), Châu Âu (Frankfurt), Châu Âu (London), Châu Á Thái Bình Dương (Tokyo), Châu Á Thái Bình Dương (Seoul), Châu Á Thái Bình Dương (Singapore), Trung Quốc (Bắc Kinh), Trung Quốc (Ninh Hạ) và GovCloud (US).

Bắt đầu với các phiên bản Amazon EC2 P3 cho Machine Learning

Để bắt đầu trong vòng vài phút, hãy tìm hiểu thêm về Amazon SageMaker hoặc sử dụng AWS Deep Learning AMI được cài đặt sẵn với các framework về deep learning như Caffe2 và Mxnet. Ngoài ra, bạn cũng có thể sử dụng NVIDIA AMI với trình điều khiển GPU và bộ công cụ CUDA được cài sẵn.

Bài viết và bài đăng trên blog

Tìm hiểu thêm về Amazon SageMaker

Nhấp vào đây để tìm hiểu thêm

Tìm hiểu thêm về Deep Learning trên AWS

Nhấp vào đây để tìm hiểu thêm

Tìm hiểu thêm về Điện toán hiệu năng cao (HPC)

Nhấp vào đây để tìm hiểu thêm
Bạn đã sẵn sàng để bắt đầu chưa?
Đăng ký
Bạn có thêm câu hỏi?
Hãy liên hệ chúng tôi