Amazon DataZone: Tự động hóa khám phá dữ liệu
Tổng quan
Tiết kiệm thời gian nhập thủ công các thuộc tính dữ liệu trong danh mục dữ liệu, điều này cũng gây ra các lỗi tiềm ẩn. Tạo bối cảnh kinh doanh và đề xuất phân tích cho tập dữ liệu, giúp nâng cao kết quả khám phá dữ liệu. Hiểu nguồn gốc dữ liệu của bạn và hiểu nguồn nào sẽ chịu ảnh hưởng từ thay đổi. Nhiều dữ liệu phong phú hơn trong danh mục dữ liệu kinh doanh cũng cải thiện trải nghiệm tìm kiếm. Giảm thời gian tìm kiếm và sử dụng dữ liệu từ vài tuần xuống còn vài ngày.
Trường hợp sử dụng
Video
Câu hỏi thường gặp
Loại thông tin nào có trong danh mục dữ liệu kinh doanh Amazon DataZone?
Trong danh mục dữ liệu kinh doanh Amazon DataZone, siêu dữ liệu kinh doanh cung cấp thông tin do doanh nhân tạo ra hoặc sử dụng và cung cấp ngữ cảnh cho dữ liệu tổ chức. Sau đây là các loại thông tin được sử dụng:
- Quyền sở hữu: Các tổ chức hiện đại tập trung vào dữ liệu sẽ sử dụng quy trình quản lý dữ liệu phân tán, trong đó các lĩnh vực kinh doanh (LOB) chịu trách nhiệm quản lý dữ liệu của riêng họ. Một danh mục theo dõi quyền sở hữu đó để các bên quan tâm có thể tìm kiếm và yêu cầu truy cập vào dữ liệu như một phần trong các tác vụ kinh doanh của họ.
- Phân loại: Khám phá dữ liệu là một tác vụ quan trọng mà siêu dữ liệu kinh doanh có thể hỗ trợ. Tính năng khám phá dữ liệu sử dụng nguyên tắc bản thể và phép phân loại được xác định tập trung của công ty để phân loại các nguồn dữ liệu và giúp bạn tìm các đối tượng dữ liệu có liên quan.
- Mối quan hệ: Bạn có thể sử dụng danh mục dữ liệu kinh doanh Amazon DataZone để thêm thông tin mối quan hệ dưới dạng siêu dữ liệu. Như với lược đồ tập dữ liệu kỹ thuật, danh mục dữ liệu kinh doanh hiển thị mối quan hệ giữa các đối tượng trong danh mục, chẳng hạn như mối quan hệ giữa cơ sở dữ liệu, tập dữ liệu và cột của chúng.
- Lược đồ: Các đề xuất AI cho mô tả có thể sử dụng lược đồ kỹ thuật và kinh doanh để tạo các mô tả và cách sử dụng được đề xuất cho dữ liệu.
- Nguồn gốc và mức tiêu thụ: Phân tích dòng dữ liệu và tác động cũng như ánh xạ tùy chỉnh từ OpenLineage đều được liên kết trong danh mục dữ liệu kinh doanh.
Tôi có thể lập danh mục gì với Amazon DataZone?
Amazon DataZone hỗ trợ các tài sản dữ liệu được gửi trực tiếp từ Danh mục dữ liệu AWS Glue và Amazon Redshift. Hai nguồn này có thể được dùng để lập danh mục dữ liệu ở các vị trí sau:
- Hồ dữ liệu của Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3)
- Nhiều cơ sở dữ liệu được xây dựng cho mục đích nhất định của AWS như Dịch vụ cơ sở dữ liệu quan hệ của Amazon (Amazon RDS) thông qua trình tìm kéo AWS Glue
- Hơn 100 bộ kết nối Amazon AppFlow hỗ trợ mang dữ liệu từ các ứng dụng của bên thứ ba như Snowflake, Salesforce và Google Analytics