SageMaker Canvas khai phá công nghệ ML không cần mã và chuẩn bị dữ liệu ở quy mô petabyte

Ngày đăng: 16 Th08 2024

Amazon SageMaker Canvas hiện cho phép các doanh nghiệp khai thác toàn bộ tiềm năng của dữ liệu bằng cách hỗ trợ các tập dữ liệu quy mô petabyte. Bắt đầu từ hôm nay, bạn có thể chuẩn bị các tập dữ liệu lớn một cách có tương tác, tạo luồng dữ liệu đầu cuối và kích hoạt thử nghiệm AutoML trên quy mô petabyte – một bước nhảy vọt đáng kể so với giới hạn 5GB trước đó. Với hơn 50 trình kết nối, giao diện "trò chuyện với dữ liệu" trực quan và hỗ trợ ở quy mô petabyte, Canvas cung cấp giải pháp ML ít mã/không cần mã có thể mở rộng để xử lý các trường hợp sử dụng thực tế của doanh nghiệp.

Kể từ hôm nay, Canvas cung cấp cho bạn các kỹ thuật lấy mẫu mới như ngẫu nhiên và phân tầng, giúp tăng hạn mức lấy mẫu gấp mười lần, lên đến 200.000 hàng. Điều này giúp bạn dễ dàng thu thập thông tin chi tiết về chất lượng dữ liệu và hiểu được tác động của quá trình chuyển đổi dữ liệu theo cách có tương tác trước khi xử lý toàn bộ tập dữ liệu, tận dụng khả năng tích hợp liền mạch mới với EMR Phi máy chủ. Canvas tự động điều chỉnh quy mô xử lý hơn 5GB dữ liệu trong quá trình lấy mẫu, chuẩn bị, xây dựng mô hình và suy luận sang EMR Phi máy chủ, khai thác toàn bộ tiềm năng dự đoán của dữ liệu thông qua trải nghiệm trực quan. Bạn phải thanh toán thêm chi phí giá EMR khi sử dụng EMR Phi máy chủ.

Tính năng hỗ trợ petabyte mới và cải thiện trải nghiệm tương tác hiện được cung cấp trên tất cả các Khu vực AWS có SageMaker Canvas.

Để bắt đầu với công nghệ ML không cần mã và chuẩn bị dữ liệu từ các tập dữ liệu lớn, hãy bật "cấu hình xử lý dữ liệu lớn" trong miền Canvas và hồ sơ người dùng của bạn bằng tài liệu kỹ thuật của chúng tôi và tìm hiểu cách sử dụng tính năng mới từ blog AWS Machine Learning. Người dùng hiện tại nên cập nhật cài đặt miền SageMaker theo tài liệu, đăng xuất khỏi không gian làm việc Canvas và đăng nhập lại để truy cập phiên bản mới nhất.