Studio hợp nhất của Amazon SageMaker hiện hỗ trợ tính năng xem trước dữ liệu nhanh hơn trong ETL trực quan

Ngày đăng: 9 Th03 2026

Studio hợp nhất của Amazon SageMaker giới thiệu tính năng xem trước dữ liệu v2.0 cho Visual ETL, một chế độ xem trước dữ liệu mới mang lại kết quả gần như tức thì khi xây dựng và lặp lại công việc ETL trực quan. Với tính năng xem trước dữ liệu v2.0, các kỹ sư và nhà phân tích dữ liệu có thể xem kết quả đầu ra của mỗi mục biến đổi trong khoảng một giây, không cần khởi động phiên và không mất thêm chi phí điện toán.

Tính năng xem trước dữ liệu v2.0 sử dụng công cụ truy vấn trong trình duyệt để tải và xử lý dữ liệu cục bộ, nhờ đó loại bỏ sự phụ thuộc vào các phiên Spark phía máy chủ cho hoạt động xem trước. Dữ liệu nguồn được tìm nạp một lần và được lưu vào bộ nhớ cache trong trình duyệt, vì vậy, các mục biến đổi tiếp sau được áp dụng ngay mà không cần truy vấn lại nguồn dữ liệu cơ bản. Đối với người dùng Amazon Redshift, điều này có nghĩa là bạn có thể lặp lại các mục biến đổi mà không cần thêm truy vấn đối với cụm Redshift, duy trì quy trình xem trước nhanh chóng và tài nguyên cụm tập trung vào khối lượng công việc sản xuất. Tính năng xem trước dữ liệu v2.0 hỗ trợ các tệp CSV, Parquet và JSON từ Amazon S3, cùng với dữ liệu từ Amazon Redshift, Bảng Amazon S3, Danh mục dữ liệu AWS Glue và các nguồn của bên thứ ba, bao gồm Snowflake, MySQL, PostgreSQL, SQL Server, Oracle, Google BigQuery, Amazon DynamoDB và Amazon DocumentDB. Bạn có một nút chuyển đổi trong trình chỉnh sửa ETL trực quan để chọn giữa tính năng xem trước dữ liệu v2.0 và bản xem trước dựa trên Spark gốc bất cứ lúc nào.

Tính năng xem trước dữ liệu v2.0 trong ETL trực quan được cung cấp ở tất cả các Khu vực AWS hỗ trợ Studio hợp nhất của Amazon SageMaker. Để tìm hiểu thêm, hãy truy cập tài liệu về Studio hợp nhất của Amazon SageMaker.