Amazon DataZone giới thiệu khả năng trực quan hóa dòng dữ liệu tương thích với OpenLineage, dựa trên API và ở dạng bản xem trước

Ngày đăng: 27 Th06 2024

Amazon DataZone giới thiệu dòng dữ liệu ở dạng bản xem trước, giúp khách hàng trực quan hóa sự kiện dòng dữ liệu từ các hệ thống hỗ trợ OpenLineage hoặc thông qua API, cũng như theo dõi quá trình di chuyển dữ liệu từ nguồn đến nơi tiêu thụ dữ liệu. Amazon DataZone là một dịch vụ quản lý dữ liệu cho khách hàng để lập danh mục, khám phá, chia sẻ và quản trị dữ liệu trên quy mô lớn, vượt qua các ranh giới tổ chức và với khả năng kiểm soát hoạt động truy cập và quản trị.

Tính năng dòng dữ liệu của Amazon DataZone ghi lại và trực quan hóa việc chuyển đổi nội dung và cột dữ liệu, cho phép bạn theo dõi quá trình di chuyển dữ liệu từ nguồn đến nơi tiêu thụ dữ liệu. Quản trị viên miền và nhà sản xuất dữ liệu có thể dùng API tương thích với OpenLineage của Amazon DataZone để thu thập cũng như lưu trữ sự kiện dòng vượt quá những sự kiện có sẵn trong Amazon DataZone, bao gồm các chuyển đổi trong Amazon S3, AWS Glue và dịch vụ khác. Nhờ khả năng theo dõi toàn bộ dòng dữ liệu, người dùng dữ liệu trong Amazon DataZone có thể tin tưởng vào nguồn gốc của tài sản. Còn nhà sản xuất dữ liệu có thể tìm hiểu mức tiêu thụ dữ liệu, từ đó đánh giá tác động của những thay đổi đối với tài sản. Ngoài ra, Amazon DataZone sẽ lập phiên bản dòng với từng sự kiện, cho phép người dùng trực quan hóa dòng tại bất kỳ thời điểm nào hoặc so sánh các chuyển đổi trong lịch sử của tài sản hoặc công việc. Dòng dữ liệu lịch sử này giúp bạn hiểu rõ hơn về cách dữ liệu đã phát triển, cần thiết cho hoạt động khắc phục sự cố, kiểm tra và xác thực tính toàn vẹn của nội dung dữ liệu.

Dòng dữ liệu của Amazon DataZone hiện đã có sẵn để xem trước ở tất cả các Khu vực AWS hỗ trợ Amazon DataZone.

Để tìm hiểu thêm, hãy truy cập Amazon DataZone, đọc Blog tin tức AWS và bắt đầu với tài liệu về dòng dữ liệu.