Amazon SageMaker cung cấp thêm phần chuyển đổi ETL trực quan và hỗ trợ Bảng S3

Ngày đăng: 6 Th05 2025

Amazon SageMaker hiện cung cấp 14 phần chuyển đổi ETL trực quan tích hợp mới: "Format timestamp", "Split string", "Regex extractor", "Autobalance processing", "UUID (Universally Unique Identified)", "Identifier", "Unpivot columns into rows", "Pivot rows into columns", "Parse JSON column", "Extract JSON path", "Lookup", "Conditional router", "Route group" và "Order by". Với những phần chuyển đổi mới này, nhà phát triển ETL có thể nhanh chóng xây dựng quy trình dữ liệu tinh vi hơn mà không cần phải viết mã tùy chỉnh cho các tác vụ chuyển đổi thường gặp. Ngoài ra, Bảng Amazon S3 hiện được hỗ trợ thông qua nút Lakehouse của Amazon SageMaker. Nhờ vậy, bạn có thể linh hoạt truy cập và xem trước dữ liệu tại chỗ trên các Bảng S3.

ETL trực quan trong Amazon SageMaker cung cấp giao diện kéo và thả để xây dựng luồng ETL và biên soạn luồng với Nhà phát triển Amazon Q. Mỗi phần chuyển đổi ETL trực quan mới giải quyết một nhu cầu xử lý dữ liệu riêng biệt. Lấy ví dụ, hãy sử dụng "Identifier" để chỉ định mã số định danh cho mỗi hàng trong tập dữ liệu, chuyển đổi chuỗi JSON bằng "Parse JSON column" để bạn có thể biến một chuỗi JSON thành một cấu trúc hoặc mảng dữ liệu hay chỉ trích xuất đường dẫn JSON bạn cần với phần chuyển đổi "Extract JSON path".

Các phần chuyển đổi ETL trực quan này hiện được cung cấp ở tất cả các khu vực AWS có Amazon SageMaker. Hãy truy cập danh sách khu vực được hỗ trợ để biết thông tin mới nhất về phạm vi hỗ trợ.

Để tìm hiểu thêm, hãy truy cập tài liệu về Amazon SageMaker của chúng tôi.