Hỏi: Các thành phần chính của Amazon DataZone là gì?
Amazon DataZone bao gồm bốn thành phần chính như sau:
- Danh mục trên toàn tổ chức: Hiển thị dữ liệu cùng bối cảnh kinh doanh để mọi người có thể tìm kiếm và nắm bắt dữ liệu một cách nhanh chóng. Lập danh mục dữ liệu trên toàn tổ chức cho phép bạn tìm kiếm và yêu cầu truy cập vào dữ liệu để phân tích.
- Xuất bản/đăng ký quy trình làm việc với tính năng quản lý truy cập: Sử dụng quy trình làm việc tự động để giúp bảo mật dữ liệu giữa đối tượng tạo và đối tượng dùng, cũng như đảm bảo người dùng phù hợp truy cập vào đúng dữ liệu cho đúng mục đích. Hợp lý hóa quá trình kiểm tra ai đang sử dụng tập dữ liệu nào cho trường hợp sử dụng kinh doanh nào, với quy trình làm việc xuất bản và đăng ký.
- Dự án dữ liệu: Đơn giản hóa việc truy cập vào công cụ phân tích của AWS bằng cách tạo các tập hợp người dùng, tài sản dữ liệu và công cụ phân tích theo trường hợp sử dụng về kinh doanh. Các dự án của Amazon DataZone cung cấp một không gian cộng tác để các thành viên trong dự án có thể cộng tác, trao đổi dữ liệu và chia sẻ các tạo tác. Các dự án chỉ cho phép người dùng được thêm vào một cách rõ ràng được truy cập vào dữ liệu và các công cụ phân tích. Các dự án đơn lẻ quản lý quyền sở hữu tài sản dữ liệu được tạo ra trong dự án theo các chính sách được người quản lý dữ liệu áp dụng, qua đó giúp phân cấp quyền sở hữu dữ liệu thông qua phương thức quản trị liên kết.
- Cổng thông tin (bên ngoài Bảng điều khiển quản lý AWS): Cổng thông tin của Amazon DataZone là trải nghiệm dữ liệu tích hợp cho người dùng nhằm thúc đẩy hoạt động khai thác và đẩy mạnh công tác đổi mới nhờ một trang chủ được tùy chỉnh theo cá nhân. Cổng thông tin là trải nghiệm không thuộc bảng điều khiển, tạo điều kiện thuận lợi cho hoạt động cộng tác liên chức năng khi làm việc với dữ liệu và các công cụ phân tích theo kiểu tự phục vụ. Cổng thông tin này xác minh thông tin chứng thực hiện có từ nhà cung cấp danh tính của bạn.
Hỏi: Danh mục của Amazon DataZone là loại danh mục nào?
Amazon DataZone giới thiệu một danh mục siêu dữ liệu kinh doanh. Siêu dữ liệu kinh doanh cung cấp thông tin do doanh nhân tạo ra hoặc sử dụng và cung cấp ngữ cảnh cho dữ liệu tổ chức. Siêu dữ liệu này có thể bao gồm các thông tin như:
- Quyền sở hữu: Các tổ chức hiện đại tập trung vào dữ liệu sẽ sử dụng quy trình quản lý dữ liệu phân tán, trong đó LOB chịu trách nhiệm quản lý dữ liệu của riêng họ. Một danh mục theo dõi quyền sở hữu đó để các bên quan tâm có thể tìm kiếm và yêu cầu truy cập vào dữ liệu như một phần trong các tác vụ kinh doanh của họ.
- Phân loại: Khám phá dữ liệu là một tác vụ quan trọng mà siêu dữ liệu kinh doanh có thể hỗ trợ. Tính năng khám phá dữ liệu sử dụng nguyên tắc bản thể và phép phân loại được xác định tập trung của công ty để phân loại các nguồn dữ liệu và cho phép bạn tìm các đối tượng dữ liệu có liên quan.
- Mối quan hệ: Bạn có thể sử dụng danh mục dữ liệu Amazon DataZone để thêm thông tin mối quan hệ dưới dạng siêu dữ liệu. Như với lược đồ tập dữ liệu kỹ thuật, danh mục siêu dữ liệu kinh doanh hiển thị mối quan hệ giữa các đối tượng trong danh mục, chẳng hạn như mối quan hệ giữa cơ sở dữ liệu, tập dữ liệu và cột của chúng.
Hỏi: Miền của Amazon DataZone là gì?
Thông qua các miền, bạn có thể sắp xếp các tài nguyên phù hợp với miền theo bối cảnh kinh doanh như LOB một cách bảo mật hơn. Miền là tập hợp các đối tượng Amazon DataZone, chẳng hạn như tài sản dữ liệu, dự án, tài khoản AWS liên quan và nguồn dữ liệu. Các miền là một bộ chứa có quy mô linh hoạt dành cho bạn, nhóm của bạn và các thực thể Amazon DataZone có liên quan, bao gồm tài sản dữ liệu và công cụ phân tích như Amazon Athena và trình soạn thảo truy vấn của Amazon Redshift. Bạn có thể xuất bản tài sản dữ liệu trong danh mục có miền cụ thể thực hiện quản trị dữ liệu. Sau đó, bạn có thể kiểm soát quyền truy cập các tài khoản AWS liên kết và tài nguyên có thể truy cập miền đó. Các miền cung cấp một cơ chế nhằm thấm nhuần kỷ luật của tổ chức cho các nhóm đang thực hiện công tác sản xuất và lập danh mục dữ liệu trong danh mục dữ liệu kinh doanh. Bạn có thể xuất bản một tài sản dữ liệu trong danh mục đến một miền cụ thể quản lý dữ liệu, đồng thời bạn có thể kiểm soát quyền truy cập của các đối tượng dùng mà có thể truy cập vào miền. Một miền có thể có nhiều dự án theo trường hợp sử dụng kinh doanh mà mọi người cộng tác trong dự án đó.
Hỏi: Amazon DataZone hỗ trợ và tích hợp với các dịch vụ khác của AWS như thế nào?
Amazon DataZone hỗ trợ ba loại hình tích hợp với các dịch vụ khác của AWS như sau:
- Nguồn dữ liệu của đối tượng tạo: Bạn có thể xuất bản tài sản dữ liệu vào danh mục Amazon DataZone từ dữ liệu được lưu trữ trong các bảng và chế độ xem của Danh mục dữ liệu AWS Glue và Amazon Redshift. Bạn cũng có thể xuất bản một cách thủ công các đường dẫn và đối tượng Amazon S3 (ví dụ như ảnh và thư mục) vào danh mục Amazon DataZone.
- Công cụ của đối tượng dùng: Bạn có thể sử dụng Amazon Athena hoặc Trình soạn thảo truy vấn của Amazon Redshift phiên bản 2 để truy cập và phân tích tài sản dữ liệu của bạn.
- Kiểm soát và cấp quyền truy cập: Amazon DataZone hỗ trợ cấp quyền truy cập vào các bảng AWS Glue do AWS Lake Formation quản lý, cũng như các bảng và chế độ xem của Amazon Redshift. Đối với tất cả tài sản dữ liệu, Amazon DataZone xuất bản các sự kiện tiêu chuẩn liên quan đến hành động của bạn (ví dụ như phê duyệt yêu cầu đăng ký) đến Amazon EventBridge. Nếu Amazon DataZone không hỗ trợ quản lý truy cập cho một tài sản dữ liệu cụ thể, bạn có thể sử dụng các sự kiện tiêu chuẩn này để cấp quyền truy cập (ví dụ như đường dẫn Amazon S3 và bảng Glue do IAM quản lý). Bạn cũng có thể tích hợp với các dịch vụ khác của AWS hoặc giải pháp của bên thứ ba để tích hợp tùy chỉnh với các sự kiện tiêu chuẩn này.
Hỏi: Cổng thông tin của Amazon DataZone là gì?
Amazon DataZone cung cấp cho các nhà phân tích dữ liệu một cổng thông tin quản lý dữ liệu thống nhất để khám phá, truy cập, chuẩn bị, phân tích và báo cáo về dữ liệu trên toàn tổ chức. Cổng thông tin cho phép họ dễ dàng cộng tác với các kỹ sư dữ liệu và quản trị viên CNTT để có được thông tin chuyên sâu từ dữ liệu của họ. Amazon DataZone cho phép người dùng sử dụng tài sản dữ liệu có trong danh mục siêu dữ liệu kinh doanh từ các trình soạn thảo truy vấn của Amazon Redshift và Athena. Bạn sử dụng tài sản dữ liệu trong một ứng dụng dựa trên web, qua đó loại bỏ thao tác đăng nhập vào bảng điều khiển AWS cho những người dùng thích trải nghiệm không thuộc bảng điều khiển.
Hỏi: Khu vực nào được hỗ trợ bản xem trước?
Ở bản xem trước của Amazon DataZone, miền gốc có thể được cung cấp ở các Khu vực AWS gồm Miền Đông Hoa Kỳ (Bắc Virginia), Miền Tây Hoa Kỳ (Oregon) hoặc Châu Âu (Ireland). Là công cụ thay thế Đăng nhập đơn của AWS, Trung tâm danh tính AWS IAM phải được cấu hình ở cùng Khu vực AWS với miền gốc. Bạn có thể xuất bản dữ liệu từ bất kỳ Khu vực nào trong số các Khu vực này vào danh mục Amazon DataZone. Người dùng có thể đăng ký dữ liệu và sử dụng dữ liệu trong cùng Khu vực như dữ liệu trong các dịch vụ phân tích của AWS như Amazon Redshift và Athena.

Bắt đầu xây dựng với Amazon DataZone trong Bảng điều khiển quản lý AWS.