Amazon SageMaker

Máy học dành cho mọi nhà khoa học dữ liệu và nhà phát triển

Amazon SageMaker là dịch vụ được quản lý toàn diện, mang đến cho mọi nhà phát triển và nhà khoa học dữ liệu khả năng xây dựng, đào tạo và triển khai các mô hình máy học (ML) một cách nhanh chóng. SageMaker loại bỏ các công việc nặng nhọc của mỗi bước trong quy trình machine learning để giúp phát triển các mô hình chất lượng cao dễ dàng hơn.

Việc phát triển ML truyền thống là một quy trình lặp lại phức tạp, tốn kém, thậm chí còn khó khăn hơn vì không có công cụ tích hợp nào cho toàn bộ dòng công việc machine learning. Bạn cần kết hợp các công cụ và dòng công việc lại với nhau nhưng việc này rất tốn thời gian và dễ bị lỗi. SageMaker giải quyết thách thức này bằng cách cung cấp tất cả các thành phần được sử dụng cho machine learning trong một bộ công cụ duy nhất để các mô hình được sản xuất nhanh hơn với ít nỗ lực hơn cũng như chi phí thấp hơn.

Xây dựng mô hình machine learning dễ dàng

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Cải thiện năng suất bằng cách sử dụng Amazon SageMaker Studio, môi trường phát triển tích hợp toàn phần (IDE) đầu tiên cho machine learning

Amazon SageMaker Studio cung cấp một giao diện trực quan duy nhất dựa trên web, nơi bạn có thể thực hiện tất cả các bước phát triển ML. SageMaker Studio mang đến cho bạn toàn quyền truy nhập, kiểm soát và khả năng quan sát từng bước cần thiết để xây dựng, đào tạo và triển khai các mô hình. Bạn có thể nhanh chóng tải lên dữ liệu, tạo sổ ghi chép mới, đào tạo và điều chỉnh các mô hình, di chuyển qua lại giữa các bước để điều chỉnh các thử nghiệm, so sánh kết quả và triển khai các mô hình để sản xuất tất cả tại một vị trí, nhờ đó giúp bạn làm việc hiệu quả hơn. Tất cả các hoạt động phát triển ML bao gồm sổ ghi chép, quản lý thử nghiệm, tạo mô hình tự động, gỡ lỗi cũng như phát hiện sai lệch mô hình có thể được thực hiện trong giao diện trực quan SageMaker Studio hợp nhất.

SageMaker Studio
SageMaker Studio

Sử dụng IDE để phát triển ML. Ví dụ: thực hiện cập nhật cho các mô hình bên trong sổ ghi chép và xem mức độ mà các thay đổi ảnh hưởng đến chất lượng mô hình bằng chế độ xem song song của sổ ghi chép và các thử nghiệm đào tạo của bạn.

Sử dụng IDE để phát triển ML. Ví dụ: thực hiện cập nhật cho các mô hình bên trong sổ ghi chép và xem mức độ mà các thay đổi ảnh hưởng đến chất lượng mô hình bằng chế độ xem song song của sổ ghi chép và các thử nghiệm đào tạo của bạn.

 Nhấp vào để phóng to

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Xây dựng và cộng tác nhanh hơn bằng Sổ ghi chép Amazon SageMaker Studio

Việc quản lý các phiên bản điện toán để xem, chạy hoặc chia sẻ sổ ghi chép là một công việc khá tẻ nhạt. Sổ ghi chép Amazon SageMaker Studio là các cuốn sổ Jupyter chỉ cần một lần nhấp chuột và có thể tăng tốc nhanh chóng. Các tài nguyên điện toán cơ bản vô cùng linh hoạt, do đó bạn có thể dễ dàng điều chỉnh các tài nguyên có sẵn và các thay đổi sẽ diễn ra tự động trong nền mà không làm gián đoạn công việc của bạn. SageMaker cũng cho phép chia sẻ sổ ghi chép chỉ với một cú nhấp chuột. Bạn có thể dễ dàng chia sẻ sổ ghi chép với người khác và họ sẽ nhận được cuốn sổ ghi chép đó, được lưu ở cùng một nơi.

Bạn có thể lựa chọn hàng chục cuốn sổ ghi chép dựng sẵn trong SageMaker để sử dụng trong các trường hợp khác nhau. Bạn cũng có thể nhận được hàng trăm thuật toán và mô hình được đào tạo sẵn trong AWS Marketplace để dễ dàng bắt đầu nhanh chóng.

Sổ ghi chép
Sổ ghi chép

Tạo một liên kết có thể chia sẻ mà không cần theo dõi phụ thuộc một cách thủ công để tạo lại mã sổ ghi chép.

Tạo một liên kết có thể chia sẻ mà không cần theo dõi phụ thuộc một cách thủ công để tạo lại mã sổ ghi chép.

 Nhấp vào để phóng to

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Tự động xây dựng, đào tạo và điều chỉnh các mô hình với khả năng quan sát và kiểm soát toàn phần với Amazon SageMaker Autopilot

Amazon SageMaker Autopilot là khả năng machine learning tự động đầu tiên trong ngành, cung cấp cho bạn quyền kiểm soát và khả năng quan sát toàn phần các mô hình ML của bạn. Các cách tiếp cận thông thường để machine learning tự động không cung cấp cho bạn thông tin chuyên sâu về dữ liệu được sử dụng trong việc tạo mô hình hoặc logic của việc tạo mô hình. Kết quả là ngay cả khi mô hình tạo ra khá tầm thường thì cũng không có cách nào để phát triển mô hình đó. Ngoài ra, bạn không có khả năng linh hoạt đánh đổi, chẳng hạn như hy sinh một chút về độ chính xác để nhận được dự đoán độ trễ thấp hơn, do các giải pháp ML tự động thông thường chỉ cung cấp một mô hình để lựa chọn.

SageMaker Autopilot tự động kiểm tra dữ liệu thô, áp dụng bộ xử lý tính năng, chọn bộ thuật toán tốt nhất, đào tạo và điều chỉnh nhiều mô hình, theo dõi hiệu năng và sau đó xếp hạng các mô hình dựa trên hiệu năng, tất cả chỉ với vài cú nhấp chuột. Kết quả nhận được là mô hình hoạt động tốt nhất mà bạn có thể triển khai trong một phần nhỏ thời gian thông thường được yêu cầu để đào tạo mô hình. Bạn có thể quan sát toàn bộ về cách mà mô hình được tạo ra cũng như mô hình đó sẽ gồm những gì, đồng thời SageMaker Autopilot cũng tích hợp với Amazon SageMaker Studio. Bạn có thể khám phá tối đa 50 mô hình khác nhau được tạo bởi SageMaker Autopilot trong SageMaker Studio để dễ dàng chọn ra mô hình tốt nhất cho trường hợp sử dụng của bạn. Những người không có kinh nghiệm máy học có thể sử dụng SageMaker Autopilot để tạo mô hình một cách dễ dàng hoặc các nhà phát triển có kinh nghiệm cũng có thể sử dụng SageMaker Autopilot để nhanh chóng phát triển mô hình cơ sở mà các nhóm có thể lặp lại.

Tìm hiểu thêm »

Autopilot
Autopilot

Tự động tạo các mô hình machine learning và chọn mô hình phù hợp nhất với trường hợp sử dụng của bạn. Ví dụ: xem lại bảng xếp hạng để so sánh hiệu quả của mỗi tùy chọn và chọn mô hình đáp ứng các yêu cầu về độ chính xác và độ trễ của bạn.

Tự động tạo các mô hình machine learning và chọn mô hình phù hợp nhất với trường hợp sử dụng của bạn. Ví dụ: xem lại bảng xếp hạng để so sánh hiệu quả của mỗi tùy chọn và chọn mô hình đáp ứng các yêu cầu về độ chính xác và độ trễ của bạn.

 Nhấp vào để phóng to

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Giảm chi phí gắn nhãn dữ liệu tới 70% khi sử dụng Amazon SageMaker Ground Truth

Các mô hình machine learning thành công được xây dựng trên một khối lượng lớn dữ liệu đào tạo có chất lượng cao. Nhưng quy trình tạo ra dữ liệu đào tạo cần thiết để xây dựng các mô hình này thường đắt đỏ, phức tạp và tốn thời gian. Amazon SageMaker Ground Truth giúp bạn xây dựng và quản lý bộ dữ liệu đào tạo có độ chính xác cao một cách nhanh chóng. Ground Truth giúp bạn dễ dàng truy nhập vào trình gắn nhãn thông qua Amazon Mechanical Turk, đồng thời cung cấp cho các trình gắn nhãn này các giao diện và dòng công việc dựng sẵn đối với các tác vụ gắn nhãn phổ biến. Bạn cũng có thể sử dụng các nhãn riêng của mình hoặc của các nhà cung cấp được Amazon đề xuất thông qua AWS Marketplace. Ngoài ra, Ground Truth sẽ liên tục tìm hiểu từ các nhãn được thực hiện bởi con người để tạo ra các ghi chú tự động, chất lượng cao giúp giảm đáng kể chi phí gắn nhãn.

Tìm hiểu thêm »

70%

GIẢM CHI PHÍ CHO VIỆC GẮN NHÃN DỮ LIỆU

Amazon SageMaker hỗ trợ các framework deep learning hàng đầu

Các framework được hỗ trợ bao gồm TensorFlow, PyTorch, Apache MXNet, Chainer, Keras, Gluon, Horovod, Scikit-learn và Deep Graph Library. 

Amazon-SageMaker_Framework-Logos_F2f3f3

Đào tạo mô hình machine learning

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Sắp xếp, theo dõi và đánh giá các hoạt động đào tạo với Amazon SageMaker Experiments

Amazon SageMaker Experiments giúp bạn sắp xếp và theo dõi các lần lặp lại trong mô hình machine learning. Việc đào tạo một mô hình ML thường đòi hỏi nhiều lần lặp lại để cô lập và đo lường tác động của việc thay đổi bộ dữ liệu, các phiên bản thuật toán và tham số của mô hình. Bạn sẽ tạo ra hàng trăm thành phần lạ như các mô hình, dữ liệu đào tạo, cấu hình nền tảng, cài đặt tham số và số liệu đào tạo trong các lần lặp này. Thông thường, các cơ chế rườm rà như bảng tính được sử dụng để theo dõi các thử nghiệm này.

SageMaker Experiments giúp bạn quản lý những lần lặp lại bằng cách tự động xác định các tham số đầu vào, cấu hình và kết quả, sau đó lưu trữ các thành phần này dưới dạng ‘thử nghiệm’. Trong giao diện trực quan của SageMaker Studio, bạn có thể duyệt các thử nghiệm hiện hoạt, tìm kiếm các thử nghiệm trước đó theo đặc điểm, xem lại kết quả của các thử nghiệm trước đó cũng như so sánh trực quan kết quả của những thử nghiệm này.

Thử nghiệm
Thử nghiệm

Theo dõi hàng ngàn thử nghiệm đào tạo để hiểu về độ chính xác trong mô hình của bạn. Ví dụ: xem trong biểu đồ thể hiện cách mà các bộ dữ liệu chuỗi thời gian khác nhau ảnh hưởng đến độ chính xác của mô hình.

Theo dõi hàng ngàn thử nghiệm đào tạo để hiểu về độ chính xác trong mô hình của bạn. Ví dụ: xem trong biểu đồ thể hiện cách mà các bộ dữ liệu chuỗi thời gian khác nhau ảnh hưởng đến độ chính xác của mô hình.

 Nhấp vào để phóng to

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Phân tích, phát hiện và báo động sự cố cho machine learning bằng Amazon SageMaker Debugger

Quy trình đào tạo ML phần lớn đều không rõ ràng và thời gian để đào tạo một mô hình có thể kéo dài và khó tối ưu hóa. Kết quả là thường rất khó để giải thích và diễn giải các mô hình. Amazon SageMaker Debugger giúp quá trình đào tạo trở nên minh bạch hơn bằng cách tự động xác định các số liệu theo thời gian thực trong quá trình đào tạo như đào tạo và xác thực, ma trận nhầm lẫn và tìm hiểu độ dốc để giúp cải thiện tính chính xác của mô hình.

Các số liệu từ SageMaker Debugger có thể được hiển thị trong SageMaker Studio để giúp bạn dễ hiểu. SageMaker Debugger cũng có thể tạo cảnh báo và tư vấn khắc phục khi phát hiện các vấn đề đào tạo phổ biến. Với SageMaker Debugger, bạn có thể giải thích cách mà một mô hình hoạt động, thể hiện bước đầu trong quá trình tiến tới khả năng giải thích mô hình.

Trình gỡ lỗi
Trình gỡ lỗi

Phân tích và gỡ lỗi bất thường. Ví dụ: việc đào tạo một mạng nơ-ron sẽ chấm dứt nếu độ dốc được xác định là biến mất. SageMaker Debugger sẽ xác định độ dốc biến mất để bạn có thể khắc phục trước khi việc đào tạo bị ảnh hưởng.

Phân tích và gỡ lỗi bất thường. Ví dụ: việc đào tạo một mạng nơ-ron sẽ chấm dứt nếu độ dốc được xác định là biến mất. SageMaker Debugger sẽ xác định độ dốc biến mất để bạn có thể khắc phục trước khi việc đào tạo bị ảnh hưởng.

 Nhấp vào để phóng to

AWS là nơi thích hợp nhất để chạy TensorFlow

Các đặc điểm tối ưu hóa trên TensorFlow của AWS mang lại hiệu quả quy mô cận tuyến tính trên hàng trăm GPU để vận hành ở quy mô đám mây trong thời gian ngắn hơn nhiều mà không phải chịu nhiều chi phí xử lý để đào tạo các mô hình chính xác, phức tạp hơn.

90%

HIỆU QUẢ MỞ RỘNG QUY MÔVỚI 256 GPU

Chi phí đào tạo thấp hơn 90%

Amazon SageMaker cung cấp Managed Spot Training để giúp bạn giảm thiểu chi phí đào tạo tới 90%. Khả năng này sử dụng các phiên bản Spot của Amazon EC2, đây là khả năng tính toán AWS dự phòng. Khi khả năng tính toán sẵn sàng, các tác vụ đào tạo sẽ chạy tự động cũng như biến đổi linh hoạt trước các gián đoạn gây ra bởi thay đổi về dung lượng, nhờ đó giúp bạn tiết kiệm chi phí một cách linh hoạt khi thực hiện các tác vụ đào tạo.

90%

GIẢM CHI PHÍ BẰNG MANAGED SPOT TRAINING

Triển khai các mô hình machine learning

Triển khai bằng một cú nhấp chuột

Amazon SageMaker tạo điều kiện thuận lợi cho việc triển khai mô hình đã đào tạo của bạn vào khâu sản xuất bằng một cú nhấp chuột. Như vậy, bạn có thể bắt đầu tạo các dự đoán đối với dữ liệu trong thời gian thực hoặc theo lô. Bạn có thể triển khai mô hình vào các phiên bản Amazon ML tự động thay đổi quy mô trên nhiều vùng sẵn sàng cho khả năng dự phòng cao chỉ với một cú nhấp chuột. Chỉ cần chỉ định loại phiên bản, số tối đa và số tối thiểu bạn muốn, SageMaker sẽ thực hiện phần còn lại. SageMaker sẽ khởi chạy các phiên bản, triển khai mô hình của bạn và thiết lập điểm cuối HTTPS an toàn cho ứng dụng của bạn. Ứng dụng của bạn chỉ cần bao gồm một lệnh gọi API cho điểm cuối này để đạt độ trễ thấp, công suất suy diễn cao. Kiến trúc này cho phép bạn tích hợp các mô hình mới vào ứng dụng sau vài phút vì các thay đổi đối với mô hình không yêu cầu thay đổi mã ứng dụng nữa.

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Giữ mô hình chính xác theo thời gian bằng Trình giám sát mô hình Amazon SageMaker

Trình giám sát mô hình Amazon SageMaker cho phép các nhà phát triển phát hiện và sửa sai lệch về khái niệm. Hiện nay, việc dữ liệu dùng để tạo dự đoán khác với dữ liệu dùng cho đào tạo về mô hình là một trong những yếu tố chính có thể gây ảnh hưởng đến tính chính xác của mô hình triển khai. Ví dụ: việc thay đổi điều kiện kinh tế có thể thúc đẩy lãi suất mới, gây ảnh hưởng tới dự đoán mua nhà. Đây là sai lệch về khái niệm, theo đó các mẫu mà mô hình sử dụng để đưa ra dự đoán không còn được áp dụng. Trình giám sát mô hình SageMaker tự động phát hiện sai lệch về khái niệm ở các mô hình được triển khai và đưa ra cảnh báo chi tiết giúp xác định nguồn gốc của vấn đề. Tất cả mô hình được đào tạo trong SageMaker đều tự động đưa ra các số liệu chính, bạn có thể thu thập và xem chúng trong SageMaker Studio. Bạn có thể đặt cấu hình dữ liệu cần thu thập, cách thức xem dữ liệu và thời điểm nhận cảnh báo ngay trong SageMaker Studio.

Trình giám sát mô hình
Trình giám sát mô hình

Giám sát các mô hình trong sản xuất. Ví dụ: xem biểu đồ với các tính năng mô hình quan trọng và số liệu thống kê tóm tắt, theo dõi chúng theo thời gian và so sánh với các tính năng dùng trong đào tạo. Một số tính năng sai lệch khi mô hình hoạt động trong sản xuất, việc này có thể cho thấy nhu cầu cần phải đào tạo lại mô hình của bạn.

Giám sát các mô hình trong sản xuất. Ví dụ: xem biểu đồ với các tính năng mô hình quan trọng và số liệu thống kê tóm tắt, theo dõi chúng theo thời gian và so sánh với các tính năng dùng trong đào tạo. Một số tính năng sai lệch khi mô hình hoạt động trong sản xuất, việc này có thể cho thấy nhu cầu cần phải đào tạo lại mô hình của bạn.

 Nhấp vào để phóng to

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Xác thực các dự đoán thông qua đánh giá của con người

Nhiều ứng dụng machine learning đòi hỏi con người phải đánh giá các dự đoán có độ tin cậy thấp để đảm bảo kết quả là chính xác. Tuy nhiên, việc đưa đánh giá của con người vào quy trình làm việc có thể gây mất thời gian và tốn kém, liên quan đến các quy trình phức tạp. Amazon Augmented AI là dịch vụ giúp dễ dàng xây dựng các quy trình làm việc cần thiết để đánh giá các dự đoán ML của con người. Augmented AI cung cấp quy trình làm việc tích hợp đánh giá của con người cho các trường hợp sử dụng machine learning thông thường. Bạn cũng có thể tạo quy trình làm việc riêng cho các mô hình được xây dựng trên Amazon SageMaker. Với Augmented AI, bạn có thể cho phép các nhà đánh giá trợ giúp khi mô hình không thể đưa ra dự đoán có độ tin cậy cao.

Tìm hiểu thêm »

Sử dụng Kubeflow Pipelines để sắp xếp công việc và lên lịch

Các thành phần Amazon SageMaker cho Kubeflow Pipelines, hiện ở dạng xem trước, là những plugin nguồn mở cho phép bạn sử dụng Kubeflow Pipelines để xác định quy trình công việc ML của bạn và sử dụng SageMaker cho các bước suy diễn, đào tạo và gắn nhãn dữ liệu. Kubeflow Pipelines là một tiện ích bổ sung cho Kubeflow, cho phép bạn xây dựng và triển khai các quy trình ML toàn diện di động và có thể thay đổi quy mô. Tuy nhiên, khi sử dụng Kubeflow Pipelines, các nhóm vận hành ML cần quản lý cụm Kubernetes với các phiên bản CPU và GPU, đồng thời luôn duy trì mức sử dụng cao để giảm chi phí vận hành. Tối đa hóa việc sử dụng một cụm trên các nhóm khoa học dữ liệu là một thách thức và làm tăng thêm chi phí hoạt động cho các nhóm vận hành ML. Là một giải pháp thay thế cho cụm Kubernetes được tối ưu hóa ML, với các thành phần Amazon SageMaker cho Kubeflow Pipelines, bạn có thể tận dụng các tính năng SageMaker mạnh mẽ như ghi nhãn dữ liệu, điều chỉnh siêu tham số quy mô lớn và quản lý đào tạo phân tán, triển khai mô hình an toàn và có thể thay đổi quy mô cũng như đào tạo hiệu quả về chi phí thông qua các phiên bản dùng ngay EC2 mà không cần phải định cấu hình và quản lý các cụm Kubernetes đặc biệt để chạy các tác vụ máy học.  

Tích hợp với Kubernetes cho việc điều phối và quản lý

Kubernetes là một hệ thống nguồn mở, dùng để tự động hóa việc triển khai, mở rộng và quản lý ứng dụng trong bộ chứa. Nhiều khách hàng muốn sử dụng chức năng được quản lý đầy đủ của Amazon SageMaker cho mô hình máy học, nhưng cũng muốn nhóm cơ sở hạ tầng và nền tảng tiếp tục sử dụng Kubernetes cho quy trình điều phối và quản lý. SageMaker cho phép người dùng đào tạo và triển khai các mô hình trong SageMaker bằng các toán tử Kubernetes.

Dùng Amazon Elastic Inference để giảm tới 75% chi phí suy diễn của mô hình máy học

Trong hầu hết ứng dụng deep learning, việc đưa ra dự đoán bằng mô hình được đào tạo - quy trình có tên gọi là suy diễn - có thể là yếu tố chính trong chi phí tính toán của ứng dụng. Phiên bản GPU đầy đủ có thể quá cỡ để suy diễn mô hình. Ngoài ra, thật khó tối ưu hóa GPU, CPU và nhu cầu bộ nhớ của ứng dụng deep-learning. Amazon Elastic Inference giải quyết các vấn đề này bằng cách cho phép bạn đính kèm mức tăng tốc suy diễn sử dụng GPU phù hợp với mọi loại phiên bản Amazon EC2 hay Amazon SageMaker hay tác vụ Amazon ECS không có thay đổi về mã. Với Elastic Inference, bạn có thể chọn loại phiên bản phù hợp nhất với nhu cầu bộ nhớ và CPU nói chung của ứng dụng, rồi đặt cấu hình mức tăng tốc suy diễn riêng mà bạn cần để sử dụng tài nguyên hiệu quả, cũng như để giảm chi phí chạy suy diễn.

75%

GIẢM CHI PHÍ SUY LUẬN

Đạt hiệu suất cao và chi phí suy luận thấp khi dùng đám mây

Với Amazon SageMaker, bạn có thể triển khai các mô hình máy học được đào tạo cho các phiên bản Amazon Inf1, được xây dựng bằng chip AWS Inferentia, để mang lại hiệu suất cao và chi phí suy luận thấp. Khi sử dụng phiên bản Inf1, bạn có thể chạy các ứng dụng suy luận của mô hình máy học ở quy mô lớn như nhận dạng hình ảnh, nhận dạng lời nói, xử lý ngôn ngữ tự nhiên, cá nhân hóa và phát hiện gian lận. Với Amazon SageMaker Neo, bạn có thể tổng hợp các mô hình máy học được đào tạo để vận hành tối ưu trên các phiên bản Inf1 và dễ dàng triển khai các mô hình đã biên soạn đó trên phiên bản Inf1 để suy luận trong thời gian thực.

Bắt đầu với Amazon SageMaker

Bắt đầu xây dựng với Amazon Sagemaker trong Bảng điều khiển quản lý AWS.