Tính năng của Amazon SageMaker Canvas

Xây dựng mô hình ML có độ chính xác cao bằng cách sử dụng giao diện trực quan, không cần đến mã

Phát triển ML dựa trên trò chuyện với Nhà phát triển Amazon Q

Nhà phát triển Amazon Q giúp thu hẹp khoảng cách giữa các thách thức kinh doanh và mô hình ML. Nhà phát triển Amazon Q sẽ dịch một cách chuyên nghiệp các vấn đề kinh doanh thành quy trình làm việc ML theo từng bước và giải thích các thuật ngữ ML bằng ngôn ngữ phi kỹ thuật.

Nhà phát triển Amazon Q hướng dẫn người dùng một cách chuyên nghiệp ở mọi bước phát triển mô hình, từ chuẩn bị dữ liệu đến xây dựng, đào tạo và triển khai các mô hình ML. Qua giao diện trò chuyện, Nhà phát triển Amazon Q cung cấp hỗ trợ theo ngữ cảnh và giúp người dùng điều hướng trong toàn bộ quy trình làm việc ML để xây dựng các mô hình ML sẵn sàng cho sản xuất.

Trình tạo quy trình tất định của Nhà phát triển Amazon Q và các kỹ thuật AutoML tiên tiến hỗ trợ khả năng tái tạo và độ chính xác trong quá trình tạo mô hình. Bằng cách hỗ trợ người dùng với các khả năng khoa học dữ liệu tiên tiến, Nhà phát triển Q cho phép thử nghiệm nhanh chóng trong khi vẫn duy trì niềm tin vào độ tiện ích của mô hình.

Nhà phát triển Amazon Q duy trì các tạo tác như tập dữ liệu gốc và tập dữ liệu được chuyển đổi, cũng như các quy trình chuẩn bị dữ liệu được tạo bằng ngôn ngữ tự nhiên. Ngoài ra, các mô hình được xây dựng bằng Nhà phát triển Q có thể được đăng ký vào Sổ đăng ký mô hình của SageMaker và sổ tay mô hình có thể được xuất ra để tùy chỉnh và tích hợp thêm.

Chuẩn bị dữ liệu

SageMaker Canvas kết nối với hơn 50 nguồn dữ liệu hoặc bạn có thể tải lên các tệp cục bộ để đào tạo mô hình ML của mình. Dữ liệu dạng bảng, hình ảnh hoặc văn bản được hỗ trợ. Bạn cũng có thể viết truy vấn để truy cập nguồn dữ liệu bằng cách sử dụng SQL và nhập dữ liệu trực tiếp ở các định dạng tệp khác nhau, chẳng hạn như CSV, Parquet, ORC và JSON và bảng cơ sở dữ liệu.
Thông qua giao diện không dùng mã của SageMaker Canvas, bạn có thể khám phá, trực quan hóa và phân tích dữ liệu bằng cách sử dụng các phương tiện trực quan hóa được tích hợp sẵn hoặc tùy chỉnh. Chỉ với một cú nhấp chuột, bạn có thể tạo báo cáo Chất lượng dữ liệu và thông tin chuyên sâu để xác minh chất lượng dữ liệu, chẳng hạn như đảm bảo tập dữ liệu không chứa các giá trị bị thiếu hoặc các hàng trùng lặp, đồng thời phát hiện các điểm bất thường như giá trị ngoại lai, tình trạng mất cân bằng giữa các lớp và rò rỉ dữ liệu.
SageMaker Canvas cung cấp hơn 300 cách thức chuyển đổi dữ liệu dựa trên PySpark được tạo sẵn, nhờ đó bạn có thể chuyển đổi dữ liệu của mình mà không cần viết một dòng mã nào. Ngoài ra, bạn có thể sử dụng giao diện trò chuyện được hỗ trợ bởi mô hình nền tảng để chuẩn bị dữ liệu của mình.
SageMaker Canvas giúp bạn dễ dàng khởi chạy hoặc lên lịch quy trình chuẩn bị dữ liệu để nhanh chóng xử lý dữ liệu của bạn và điều chỉnh quy mô chuẩn bị dữ liệu trên các tập dữ liệu, xuất dữ liệu sang sổ tay Studio SageMaker hoặc tích hợp với Quy trình của SageMaker.

Truy cập và xây dựng mô hình ML

Thông qua giao diện không dùng mã của SageMaker Canvas, bạn có thể tự động xây dựng các mô hình ML tùy chỉnh bằng cách sử dụng dữ liệu công ty của mình. Sau khi bạn chọn và chuẩn bị dữ liệu của mình và xác định những điều bạn muốn dự đoán, SageMaker Canvas sẽ xác định loại vấn đề, kiểm thử hàng trăm mô hình ML dựa trên loại vấn đề (sử dụng các kỹ thuật ML như hồi quy tuyến tính, hồi quy logistic, học sâu, dự báo theo chuỗi thời gian và thuật toán tăng cường độ dốc) và tạo mô hình tùy chỉnh có khả năng đưa ra dự đoán chính xác nhất dựa trên tập dữ liệu của bạn. Ngoài ra, bạn có thể mang mô hình được xây dựng trước đó của riêng mình vào SageMaker Canvas và triển khai mô hình để suy luận.

SageMaker Canvas cung cấp quyền truy cập vào các mô hình dạng bảng, NLP và CV sẵn sàng sử dụng cho nhiều trường hợp sử dụng bao gồm phân tích cảm xúc, phát hiện đối tượng trong hình ảnh, phát hiện văn bản trong hình ảnh và trích xuất thực thể. Các mô hình sẵn sàng sử dụng không yêu cầu xây dựng mô hình và được hỗ trợ bởi các dịch vụ AI của AWS, bao gồm Amazon Rekognition, Amazon TextractAmazon Comprehend.

Sau khi xây dựng mô hình của mình, bạn có thể đánh giá độ hiệu quả của mô hình trước khi triển khai vào sản xuất bằng dữ liệu công ty. Bạn có thể dễ dàng so sánh các phản hồi của mô hình và chọn phản hồi phù hợp nhất với nhu cầu của bạn.

SageMaker Canvas cung cấp quyền truy cập vào các mô hình nền tảng (FM) sẵn sàng sử dụng để tạo nội dung, trích xuất văn bản và tóm tắt văn bản. Bạn có thể truy cập các FM như Claude 2, Llama-2, Amazon Titan, Jurassic-2 và Command (được hỗ trợ bởi Amazon Bedrock), cũng như các FM được cung cấp công khai như Falcon, Flan-T5, Mistral, Dolly và MPT (được hỗ trợ bởi SageMaker JumpStart) và điều chỉnh bằng dữ liệu của riêng bạn.

Tạo dự đoán dựa trên ML

SageMaker Canvas cung cấp phân tích tình huống giả định trực quan để bạn có thể thay đổi đầu vào của mô hình và sau đó hiểu cách các thay đổi đó tác động đến từng dự đoán. Bạn có thể tạo dự đoán hàng loạt tự động cho toàn bộ tập dữ liệu và khi tập dữ liệu được cập nhật, mô hình ML của bạn sẽ tự động cập nhật. Sau khi mô hình ML được cập nhật, bạn có thể xem lại các dự đoán được cập nhật từ giao diện không dùng mã của SageMaker Canvas.

Bạn có thể triển khai mô hình SageMaker Canvas của mình tới các điểm cuối SageMaker để suy luận theo thời gian thực.

Chia sẻ dự đoán của mô hình với Amazon QuickSight để tạo bảng thông tin có khả năng kết hợp nghiệp vụ thông minh truyền thống và dữ liệu dự đoán trong cùng một hình ảnh tương tác trực quan. Ngoài ra, các mô hình SageMaker Canvas có thể được chia sẻ và tích hợp trực tiếp trong QuickSight, cho phép các nhà phân tích tạo dự đoán có độ chính xác cao cho dữ liệu mới trong bảng thông tin QuickSight.

Tận dụng MLOps

Bạn có thể đăng ký mô hình ML được tạo trong SageMaker Canvas vào Sổ đăng ký mô hình của SageMaker chỉ với một cú nhấp chuột duy nhất để tích hợp mô hình vào các quy trình CI/CD hiện có trong việc triển khai mô hình.

Bạn có thể chia sẻ các mô hình của SageMaker Canvas với các nhà khoa học dữ liệu mà có sử dụng SageMaker Studio. Sau đó, các nhà khoa học dữ liệu có thể xem xét, cập nhật và chia sẻ các mô hình được cập nhật với bạn hoặc triển khai mô hình của bạn để suy luận.