AWS 上具有分布式数据资产所有权的安全数据网格的指南

概览

本指南介绍了如何在 AWS 上构建数据网格架构，以实现分散的、域驱动的数据管理方法。它为您提供所有权和灵活性，以提供有价值的数据产品，促进更好的决策、个性化体验和运营效率。该指南阐述了如何通过典型数据网格设计中的分布式、去中心化所有权，利用各种 AWS 服务、用户和关键资源来应对高级数据安全挑战。根据本指南，可以通过集中管理的数据共享和治理准则有效地统一和链接不同的数据来源。这使您可以控制如何访问共享数据、谁可以访问共享数据，以及访问格式。

工作原理

概述

此架构图描绘了数据网格设计的总体情况，该设计可实现分布式数据所有权和控制权，同时提供集中式数据共享和治理，以应对安全挑战。随后的图表重点介绍了实施该设计模式时使用的基本 AWS 服务。

下载架构图

Diagram illustrating a data sharing architecture with three sections: data producers (AWS accounts managing data storage and catalogs), central governance (AWS account handling data stewards, admins, access control, and audits), and data consumers (AWS accounts accessing data for search and compute).

架构和核心 AWS 服务

此架构图展示了关键的 AWS 服务，这些服务使本指南的各个组件能够在 AWS 上的数据网格架构中无缝运行。

下载架构图

Diagram illustrating the core services of an AWS secure data mesh architecture, featuring components for data producers, central governance, and data consumers. Key AWS services include IAM Identity Center, IAM, RedShift, S3, Glue Crawler, Glue Data Catalog, DataZone, Lake Formation, KMS, Secrets Manager, CloudWatch, CloudTrail, SageMaker, QuickSight, Bedrock, Athena, and EMR. The diagram is organized into three main sections, showing service roles and interactions across producers, governance, and consumers.

Well-Architected 支柱

上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构，您应该遵循尽可能多的 Well-Architected 最佳实践。

您可以通过 CloudWatch 全面了解您的资源和服务，从而实现主动监控、快速故障排除和及时事件响应。您还可以通过 CloudTrail 审核 AWS 账户，通过详细的活动日志支持治理和合规性。使用这些服务可以维护架构的卓越运营并有效应对事件和事故。

阅读《卓越运营》白皮书

使用 IAM 和 AWS KMS 优先考虑数据和资源的安全。IAM 允许您集中管理细粒度的权限，指定谁或什么可以访问您的 AWS 服务和资源。另一方面，AWS KMS 允许您定义静态和传输中数据加密的加密密钥，从而保护敏感信息的机密性和完整性。

阅读《安全性》白皮书

使用 Amazon S3 和 Data Catalog 保障数据和应用程序的可靠性。Amazon S3 旨在提供高耐用性和可用性，可自动在多个可用区域复制您的数据。Data Catalog 充当集中式元数据存储库，帮助您在不同的数据存储中维护一致且可靠的数据来源视图。

阅读《可靠性》白皮书

使用 Amazon Redshift 和 Athena 优化数据处理和分析的性能。Amazon Redshift 是一项完全托管的大规模并行处理（MPP）数据仓库服务，可帮助您快速且经济高效地做出业务决策。Athena 是一项无服务器交互式查询服务，让您可以使用标准 SQL 直接在 Amazon S3 中分析数据，而无需管理任何基础设施。

阅读《性能效率》白皮书

作为一项完全托管的无服务器服务，Amazon S3 无需配置和管理基础设施，从而降低了相关成本。使用 Amazon S3 提供的各种存储类，包括 Amazon S3 Intelligent-Tiering 存储类、S3 Standard、S3 Standard-IA 和 S3 Glacier，以最具成本效益的选项满足您的数据存储和访问需求。

阅读《成本优化》白皮书

Amazon DataZone 有助于减少数据冗余、执行数据治理策略并促进安全的数据共享，从而优化存储使用率并降低对环境的影响。通过集中数据并启用协作数据共享，您可以最大限度地降低整个组织内部的数据重复需求，从而帮助建立更可持续的数据环境。

阅读《可持续性》白皮书

免责声明

示例代码；软件库；命令行工具；概念验证；模板；或其他相关技术（包括由我方人员提供的任何前述项）作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议（以适用者为准）向您提供。您不应将这些 AWS 内容用在您的生产账户中，或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容，例如示例代码，以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源（例如，运行 Amazon EC2 实例或使用 Amazon S3 存储）而产生 AWS 费用。

找到今天要查找的内容了吗？

请提供您的意见，以便我们改进网页内容的质量

AWS 上具有分布式数据资产所有权的安全数据网格的指南

概览

工作原理

概述

架构和核心 AWS 服务

Well-Architected 支柱

卓越运营

安全性

可靠性

性能效率

成本优化

可持续性

免责声明

找到今天要查找的内容了吗？

了解

资源

开发人员

帮助