Dòng chảy Apache Spark hiện có sẵn trong Studio hợp nhất của Amazon SageMaker cho các miền dựa trên IDC

Ngày đăng: 4 Th02 2026

Amazon SageMaker công bố việc cung cấp rộng rãi Dòng chảy dữ liệu cho các tác vụ Apache Spark được thực thi trên Amazon EMR và AWS Glue trong Studio hợp nhất của SageMaker cho các miền dựa trên IDC. Dòng chảy dữ liệu cung cấp cho bạn thông tin cần thiết để xác định nguyên nhân gốc rễ của các vấn đề phức tạp và hiểu tác động của những thay đổi.

Tính năng này hỗ trợ thu thập dòng chảy lược đồ và chuyển đổi tài sản dữ liệu và cột từ các tác vụ thực thi Spark trong EMR-EC2, EMR-Serverless, EMR-EKS và AWS Glue. Sau đó, bạn có thể khám phá dòng chảy này một cách trực quan dưới dạng biểu đồ trong Studio hợp nhất của SageMaker hoặc truy vấn bằng API. Bạn cũng có thể sử dụng dòng chảy để so sánh sự chuyển đổi trong lịch sử tác vụ Spark.

Dòng chảy Spark được cung cấp trong tất cả các khu vực hỗ trợ Studio hợp nhất của SageMaker hiện có. Để biết thông tin chi tiết về cách bắt đầu chế độ dòng chảy bằng các tính năng mới này, vui lòng tham khảo tài liệu.