Amazon SageMaker

Machine learning dành cho mọi nhà khoa học dữ liệu và nhà phát triển

Amazon SageMaker là dịch vụ được quản lý toàn phần mang đến cho mọi nhà phát triển và nhà khoa học dữ liệu khả năng xây dựng, đào tạo và triển khai các mô hình machine learning (ML) một cách nhanh chóng. SageMaker loại bỏ các công việc nặng nhọc từ mỗi bước của quy trình machine learning để giúp phát triển các mô hình chất lượng cao dễ dàng hơn.

Việc phát triển ML truyền thống là một quy trình lặp lại phức tạp, tốn kém, thậm chí còn khó khăn hơn vì không có công cụ tích hợp nào cho toàn bộ dòng công việc machine learning. Bạn cần kết hợp các công cụ và dòng công việc lại với nhau nhưng việc này rất tốn thời gian và dễ bị lỗi. SageMaker giải quyết thách thức này bằng cách cung cấp tất cả các thành phần được sử dụng cho machine learning trong một bộ công cụ duy nhất để các mô hình được sản xuất nhanh hơn với ít nỗ lực hơn cũng như chi phí thấp hơn.

Xây dựng mô hình machine learning dễ dàng

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Cải thiện năng suất bằng cách sử dụng Amazon SageMaker Studio, môi trường phát triển tích hợp toàn phần (IDE) đầu tiên cho machine learning

Amazon SageMaker Studio cung cấp một giao diện trực quan duy nhất dựa trên web, nơi bạn có thể thực hiện tất cả các bước phát triển ML. SageMaker Studio mang đến cho bạn toàn quyền truy nhập, kiểm soát và khả năng quan sát từng bước cần thiết để xây dựng, đào tạo và triển khai các mô hình. Bạn có thể nhanh chóng tải lên dữ liệu, tạo sổ ghi chép mới, đào tạo và điều chỉnh các mô hình, di chuyển qua lại giữa các bước để điều chỉnh các thử nghiệm, so sánh kết quả và triển khai các mô hình để sản xuất tất cả tại một vị trí, nhờ đó giúp bạn làm việc hiệu quả hơn. Tất cả các hoạt động phát triển ML bao gồm sổ ghi chép, quản lý thử nghiệm, tạo mô hình tự động, gỡ lỗi cũng như phát hiện sai lệch mô hình có thể được thực hiện trong giao diện trực quan SageMaker Studio hợp nhất.

SageMaker Studio
SageMaker Studio

Sử dụng IDE để phát triển ML. Ví dụ: thực hiện cập nhật cho các mô hình bên trong sổ ghi chép và xem mức độ mà các thay đổi ảnh hưởng đến chất lượng mô hình bằng chế độ xem song song của sổ ghi chép và các thử nghiệm đào tạo của bạn.

Sử dụng IDE để phát triển ML. Ví dụ: thực hiện cập nhật cho các mô hình bên trong sổ ghi chép và xem mức độ mà các thay đổi ảnh hưởng đến chất lượng mô hình bằng chế độ xem song song của sổ ghi chép và các thử nghiệm đào tạo của bạn.

 Nhấp vào để phóng to

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Xây dựng và cộng tác nhanh hơn với Sổ ghi chép Amazon SageMaker

Việc quản lý các phiên bản điện toán để xem, chạy hoặc chia sẻ sổ ghi chép là một công việc khá tẻ nhạt. Hiện đã có sẵn ở dạng bản xem trước, Sổ ghi chép Amazon SageMaker cung cấp sổ ghi chép Jupyter với chỉ một lần nhấp chuột là bạn có thể bắt đầu làm việc ngay lập tức. Các tài nguyên điện toán cơ bản vô cùng linh hoạt, do đó bạn có thể dễ dàng truy nhập hoặc hủy truy nhập các tài nguyên có sẵn và các thay đổi sẽ diễn ra tự động trong nền mà không làm gián đoạn công việc của bạn. SageMaker cũng cho phép chia sẻ sổ ghi chép chỉ với một cú nhấp chuột. Tất cả các phụ thuộc mã được tự động xác định nên bạn có thể dễ dàng cộng tác với những người khác. Họ sẽ nhận được cùng một sổ ghi chép được lưu ở cùng một vị trí.

Bạn có thể lựa chọn từ hàng tá sổ ghi chép dựng sẵn trong SageMaker để sử dụng trong các trường hợp khác nhau. Bạn cũng có thể nhận được hàng trăm thuật toán và mô hình được đào tạo sẵn trong AWS Marketplace để dễ dàng bắt đầu nhanh chóng.

Sổ ghi chép
Sổ ghi chép

Tạo một liên kết có thể chia sẻ mà không cần theo dõi phụ thuộc một cách thủ công để tạo lại mã sổ ghi chép.

Tạo một liên kết có thể chia sẻ mà không cần theo dõi phụ thuộc một cách thủ công để tạo lại mã sổ ghi chép.

 Nhấp vào để phóng to

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Tự động xây dựng, đào tạo và điều chỉnh các mô hình với khả năng quan sát và kiểm soát toàn phần với Amazon SageMaker Autopilot

Amazon SageMaker Autopilot là khả năng machine learning tự động đầu tiên trong ngành, cung cấp cho bạn quyền kiểm soát và khả năng quan sát toàn phần các mô hình ML của bạn. Các cách tiếp cận thông thường để machine learning tự động không cung cấp cho bạn thông tin chuyên sâu về dữ liệu được sử dụng trong việc tạo mô hình hoặc logic của việc tạo mô hình. Kết quả là ngay cả khi mô hình tạo ra khá tầm thường thì cũng không có cách nào để phát triển mô hình đó. Ngoài ra, bạn không có khả năng linh hoạt đánh đổi, chẳng hạn như hy sinh một chút về độ chính xác để nhận được dự đoán độ trễ thấp hơn, do các giải pháp ML tự động thông thường chỉ cung cấp một mô hình để lựa chọn.

SageMaker Autopilot tự động kiểm tra dữ liệu thô, áp dụng bộ xử lý tính năng, chọn bộ thuật toán tốt nhất, đào tạo và điều chỉnh nhiều mô hình, theo dõi hiệu năng và sau đó xếp hạng các mô hình dựa trên hiệu năng, tất cả chỉ với vài cú nhấp chuột. Kết quả nhận được là mô hình hoạt động tốt nhất mà bạn có thể triển khai trong một phần nhỏ thời gian thông thường được yêu cầu để đào tạo mô hình. Bạn có thể quan sát toàn bộ về cách mà mô hình được tạo ra cũng như mô hình đó sẽ gồm những gì, đồng thời SageMaker Autopilot cũng tích hợp với Amazon SageMaker Studio. Bạn có thể khám phá tối đa 50 mô hình khác nhau được tạo bởi SageMaker Autopilot trong SageMaker Studio để dễ dàng chọn ra mô hình tốt nhất cho trường hợp sử dụng của bạn. Những người không có kinh nghiệm machine learning có thể sử dụng SageMaker Autopilot để tạo mô hình một cách dễ dàng hoặc các nhà phát triển có kinh nghiệm cũng có thể sử dụng SageMaker Autopilot để nhanh chóng phát triển mô hình cơ sở mà các nhóm có thể lặp lại.

Tìm hiểu thêm »

Autopilot
Autopilot

Tự động tạo các mô hình machine learning và chọn mô hình phù hợp nhất với trường hợp sử dụng của bạn. Ví dụ: xem lại bảng xếp hạng để so sánh hiệu quả của mỗi tùy chọn và chọn mô hình đáp ứng các yêu cầu về độ chính xác và độ trễ của bạn.

Tự động tạo các mô hình machine learning và chọn mô hình phù hợp nhất với trường hợp sử dụng của bạn. Ví dụ: xem lại bảng xếp hạng để so sánh hiệu quả của mỗi tùy chọn và chọn mô hình đáp ứng các yêu cầu về độ chính xác và độ trễ của bạn.

 Nhấp vào để phóng to

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Giảm chi phí gắn nhãn dữ liệu tới 70% khi sử dụng Amazon SageMaker Ground Truth

Các mô hình machine learning thành công được xây dựng trên một khối lượng lớn dữ liệu đào tạo có chất lượng cao. Nhưng quy trình tạo ra dữ liệu đào tạo cần thiết để xây dựng các mô hình này thường đắt đỏ, phức tạp và tốn thời gian. Amazon SageMaker Ground Truth giúp bạn xây dựng và quản lý bộ dữ liệu đào tạo có độ chính xác cao một cách nhanh chóng. Ground Truth giúp bạn dễ dàng truy nhập vào trình gắn nhãn thông qua Amazon Mechanical Turk, đồng thời cung cấp cho các trình gắn nhãn này các giao diện và dòng công việc dựng sẵn đối với các tác vụ gắn nhãn phổ biến. Bạn cũng có thể sử dụng các nhãn riêng của mình hoặc của các nhà cung cấp được Amazon đề xuất thông qua AWS Marketplace. Ngoài ra, Ground Truth sẽ liên tục tìm hiểu từ các nhãn được thực hiện bởi con người để tạo ra các ghi chú tự động, chất lượng cao giúp giảm đáng kể chi phí gắn nhãn.

Tìm hiểu thêm »

70%

GIẢM CHI PHÍ CHO VIỆC GẮN NHÃN DỮ LIỆU

Amazon SageMaker hỗ trợ các framework deep learning hàng đầu

Các framework được hỗ trợ bao gồm TensorFlow, PyTorch, Apache MXNet, Chainer, Keras, Gluon, Horovod, Scikit-learn và Deep Graph Library. 

Amazon-SageMaker_Framework-Logos_F2f3f3

Đào tạo mô hình machine learning

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Sắp xếp, theo dõi và đánh giá các hoạt động đào tạo với Amazon SageMaker Experiments

Amazon SageMaker Experiments giúp bạn sắp xếp và theo dõi các lần lặp lại trong mô hình machine learning. Việc đào tạo một mô hình ML thường đòi hỏi nhiều lần lặp lại để cô lập và đo lường tác động của việc thay đổi bộ dữ liệu, các phiên bản thuật toán và tham số của mô hình. Bạn sẽ tạo ra hàng trăm thành phần lạ như các mô hình, dữ liệu đào tạo, cấu hình nền tảng, cài đặt tham số và số liệu đào tạo trong các lần lặp này. Thông thường, các cơ chế rườm rà như bảng tính được sử dụng để theo dõi các thử nghiệm này.

SageMaker Experiments giúp bạn quản lý những lần lặp lại bằng cách tự động xác định các tham số đầu vào, cấu hình và kết quả, sau đó lưu trữ các thành phần này dưới dạng ‘thử nghiệm’. Trong giao diện trực quan của SageMaker Studio, bạn có thể duyệt các thử nghiệm hiện hoạt, tìm kiếm các thử nghiệm trước đó theo đặc điểm, xem lại kết quả của các thử nghiệm trước đó cũng như so sánh trực quan kết quả của những thử nghiệm này.

Thử nghiệm
Thử nghiệm

Theo dõi hàng ngàn thử nghiệm đào tạo để hiểu về độ chính xác trong mô hình của bạn. Ví dụ: xem trong biểu đồ thể hiện cách mà các bộ dữ liệu chuỗi thời gian khác nhau ảnh hưởng đến độ chính xác của mô hình.

Theo dõi hàng ngàn thử nghiệm đào tạo để hiểu về độ chính xác trong mô hình của bạn. Ví dụ: xem trong biểu đồ thể hiện cách mà các bộ dữ liệu chuỗi thời gian khác nhau ảnh hưởng đến độ chính xác của mô hình.

 Nhấp vào để phóng to

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Phân tích, phát hiện và báo động sự cố cho machine learning bằng Amazon SageMaker Debugger

Quy trình đào tạo ML phần lớn đều không rõ ràng và thời gian để đào tạo một mô hình có thể kéo dài và khó tối ưu hóa. Kết quả là thường rất khó để giải thích và diễn giải các mô hình. Amazon SageMaker Debugger giúp quá trình đào tạo trở nên minh bạch hơn bằng cách tự động xác định các số liệu theo thời gian thực trong quá trình đào tạo như đào tạo và xác thực, ma trận nhầm lẫn và tìm hiểu độ dốc để giúp cải thiện tính chính xác của mô hình.

Các số liệu từ SageMaker Debugger có thể được hiển thị trong SageMaker Studio để giúp bạn dễ hiểu. SageMaker Debugger cũng có thể tạo cảnh báo và tư vấn khắc phục khi phát hiện các vấn đề đào tạo phổ biến. Với SageMaker Debugger, bạn có thể giải thích cách mà một mô hình hoạt động, thể hiện bước đầu trong quá trình tiến tới khả năng giải thích mô hình.

Trình gỡ lỗi
Trình gỡ lỗi

Phân tích và gỡ lỗi bất thường. Ví dụ: việc đào tạo một mạng nơ-ron sẽ chấm dứt nếu độ dốc được xác định là biến mất. SageMaker Debugger sẽ xác định độ dốc biến mất để bạn có thể khắc phục trước khi việc đào tạo bị ảnh hưởng.

Phân tích và gỡ lỗi bất thường. Ví dụ: việc đào tạo một mạng nơ-ron sẽ chấm dứt nếu độ dốc được xác định là biến mất. SageMaker Debugger sẽ xác định độ dốc biến mất để bạn có thể khắc phục trước khi việc đào tạo bị ảnh hưởng.

 Nhấp vào để phóng to

AWS là nơi thích hợp nhất để chạy TensorFlow

Các đặc điểm tối ưu hóa trên TensorFlow của AWS mang lại hiệu quả quy mô cận tuyến tính trên hàng trăm GPU để vận hành ở quy mô đám mây trong thời gian ngắn hơn nhiều mà không phải chịu nhiều chi phí xử lý để đào tạo các mô hình chính xác, phức tạp hơn.

90%

HIỆU QUẢ MỞ RỘNG QUY MÔVỚI 256 GPU

Chi phí đào tạo thấp hơn 90%

Amazon SageMaker cung cấp Managed Spot Training để giúp bạn giảm thiểu chi phí đào tạo tới 90%. Khả năng này sử dụng các phiên bản Spot của Amazon EC2, đây là khả năng tính toán AWS dự phòng. Khi khả năng tính toán sẵn sàng, các tác vụ đào tạo sẽ chạy tự động cũng như biến đổi linh hoạt trước các gián đoạn gây ra bởi thay đổi về dung lượng, nhờ đó giúp bạn tiết kiệm chi phí một cách linh hoạt khi thực hiện các tác vụ đào tạo.

90%

GIẢM CHI PHÍ BẰNG MANAGED SPOT TRAINING

Triển khai các mô hình machine learning

Triển khai bằng một cú nhấp chuột

Amazon SageMaker tạo điều kiện thuận lợi cho việc triển khai mô hình đã đào tạo của bạn vào khâu sản xuất bằng một cú nhấp chuột. Như vậy, bạn có thể bắt đầu tạo các dự đoán đối với dữ liệu trong thời gian thực hoặc theo lô. Bạn có thể triển khai mô hình vào các phiên bản Amazon ML tự động thay đổi quy mô trên nhiều vùng sẵn sàng cho khả năng dự phòng cao chỉ với một cú nhấp chuột. Chỉ cần chỉ định loại phiên bản, số tối đa và số tối thiểu bạn muốn, SageMaker sẽ thực hiện phần còn lại. SageMaker sẽ khởi chạy các phiên bản, triển khai mô hình của bạn và thiết lập điểm cuối HTTPS an toàn cho ứng dụng của bạn. Ứng dụng của bạn chỉ cần bao gồm một lệnh gọi API cho điểm cuối này để đạt độ trễ thấp, công suất suy diễn cao. Kiến trúc này cho phép bạn tích hợp các mô hình mới vào ứng dụng sau vài phút vì các thay đổi đối với mô hình không yêu cầu thay đổi mã ứng dụng nữa.

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Giữ mô hình chính xác theo thời gian bằng Trình giám sát mô hình Amazon SageMaker

Trình giám sát mô hình Amazon SageMaker cho phép các nhà phát triển phát hiện và sửa sai lệch về khái niệm. Hiện nay, việc dữ liệu dùng để tạo dự đoán khác với dữ liệu dùng cho đào tạo về mô hình là một trong những yếu tố chính có thể gây ảnh hưởng đến tính chính xác của mô hình triển khai. Ví dụ: việc thay đổi điều kiện kinh tế có thể thúc đẩy lãi suất mới, gây ảnh hưởng tới dự đoán mua nhà. Đây là sai lệch về khái niệm, theo đó các mẫu mà mô hình sử dụng để đưa ra dự đoán không còn được áp dụng. Trình giám sát mô hình SageMaker tự động phát hiện sai lệch về khái niệm ở các mô hình được triển khai và đưa ra cảnh báo chi tiết giúp xác định nguồn gốc của vấn đề. Tất cả mô hình được đào tạo trong SageMaker đều tự động đưa ra các số liệu chính, bạn có thể thu thập và xem chúng trong SageMaker Studio. Bạn có thể đặt cấu hình dữ liệu cần thu thập, cách thức xem dữ liệu và thời điểm nhận cảnh báo ngay trong SageMaker Studio.

Trình giám sát mô hình
Trình giám sát mô hình

Giám sát các mô hình trong sản xuất. Ví dụ: xem biểu đồ với các tính năng mô hình quan trọng và số liệu thống kê tóm tắt, theo dõi chúng theo thời gian và so sánh với các tính năng dùng trong đào tạo. Một số tính năng sai lệch khi mô hình hoạt động trong sản xuất, việc này có thể cho thấy nhu cầu cần phải đào tạo lại mô hình của bạn.

Giám sát các mô hình trong sản xuất. Ví dụ: xem biểu đồ với các tính năng mô hình quan trọng và số liệu thống kê tóm tắt, theo dõi chúng theo thời gian và so sánh với các tính năng dùng trong đào tạo. Một số tính năng sai lệch khi mô hình hoạt động trong sản xuất, việc này có thể cho thấy nhu cầu cần phải đào tạo lại mô hình của bạn.

 Nhấp vào để phóng to

CHỈ CÓ TRÊN AMAZON SAGEMAKER

Xác thực các dự đoán thông qua đánh giá của con người

Nhiều ứng dụng machine learning đòi hỏi con người phải đánh giá các dự đoán có độ tin cậy thấp để đảm bảo kết quả là chính xác. Tuy nhiên, việc đưa đánh giá của con người vào quy trình làm việc có thể gây mất thời gian và tốn kém, liên quan đến các quy trình phức tạp. Amazon Augmented AI là dịch vụ giúp dễ dàng xây dựng các quy trình làm việc cần thiết để đánh giá các dự đoán ML của con người. Augmented AI cung cấp quy trình làm việc tích hợp đánh giá của con người cho các trường hợp sử dụng machine learning thông thường. Bạn cũng có thể tạo quy trình làm việc riêng cho các mô hình được xây dựng trên Amazon SageMaker. Với Augmented AI, bạn có thể cho phép các nhà đánh giá trợ giúp khi mô hình không thể đưa ra dự đoán có độ tin cậy cao.

Tìm hiểu thêm »

Dùng Amazon Elastic Inference để giảm chi phí suy diễn machine learning tới 75%.

Trong hầu hết ứng dụng deep learning, việc đưa ra dự đoán bằng mô hình được đào tạo - quy trình có tên gọi là suy diễn - có thể là yếu tố chính trong chi phí tính toán của ứng dụng. Phiên bản GPU đầy đủ có thể quá cỡ để suy diễn mô hình. Ngoài ra, thật khó tối ưu hóa GPU, CPU và nhu cầu bộ nhớ của ứng dụng deep-learning. Amazon Elastic Inference giải quyết các vấn đề này bằng cách cho phép bạn đính kèm mức tăng tốc suy diễn sử dụng GPU phù hợp với mọi loại phiên bản Amazon EC2 hay Amazon SageMaker hay tác vụ Amazon ECS không có thay đổi về mã. Với Elastic Inference, bạn có thể chọn loại phiên bản phù hợp nhất với nhu cầu bộ nhớ và CPU nói chung của ứng dụng, rồi đặt cấu hình mức tăng tốc suy diễn riêng mà bạn cần để sử dụng tài nguyên hiệu quả, cũng như để giảm chi phí chạy suy diễn.

75%

GIẢM CHI PHÍ SUY DIỄN

Tích hợp với Kubernetes cho việc điều phối và quản lý

Kubernetes là một hệ thống nguồn mở, dùng để tự động hóa việc triển khai, mở rộng và quản lý ứng dụng trong bộ chứa. Nhiều khách hàng muốn sử dụng chức năng được quản lý đầy đủ của Amazon SageMaker cho machine learning, nhưng cũng muốn nhóm cơ sở hạ tầng và nền tảng tiếp tục sử dụng Kubernetes cho quy trình điều phối và quản lý. SageMaker cho phép người dùng đào tạo và triển khai các mô hình trong SageMaker bằng các quy trình và toán tử Kubernetes. Người dùng Kubernetes có thể truy cập tất cả các chức năng của SageMaker ngay từ Kubeflow.

Bắt đầu với Amazon SageMaker

Bắt đầu xây dựng với Amazon Sagemaker trong Bảng điều khiển quản lý AWS.