AWS Clean Rooms 是一项服务,可以让您和您的合作伙伴更轻松地分析和协作处理集体数据集,从而获得见解,而无需共享或复制彼此的基础数据,也不必将其移出 AWS。您可以使用 AWS Clean Rooms 在几分钟内创建自己的洁净室,然后只需单击几下即可开始分析您的集体数据集。在 AWS 管理控制台中或借助 API,您可以邀请任何您想要与之合作的 AWS 客户,选择数据集,并为参与者配置限制。借助 AWS Clean Rooms,您可以与已经在使用 AWS 的数十万家公司协作,而无需在您的 AWS 环境之外维护您的数据副本或将其加载到另一个平台。当您运行查询时,AWS Clean Rooms 会在其所在的位置读取数据,并应用分析规则来帮助您保持对数据的控制。AWS Clean Rooms 提供了一套广泛的隐私增强控制,包括查询控制、查询输出限制和查询日志记录,允许您自定义对每个净室参与者运行的查询的限制。AWS Clean Rooms 还包括高级加密计算工具,即使在处理查询时也能保持数据加密,以符合严格的数据处理策略。
关键产品功能
多方(最多五个数据协作者)
借助 AWS Clean Rooms,您可以在一次协作中与多达四个其他方分析数据。您可以安全地从多个公司生成见解,而无需编写代码。您可以创建洁净室,邀请您希望与之协作的公司,并选择哪些参与者可以在协作中运行分析。
无需在 AWS 环境之外维护数据副本即可进行协作
借助 AWS Clean Rooms,您可以轻松地与已经在使用 AWS 的数十万家公司协作,而无需在您的 AWS 环境之外维护您的数据副本或将其加载到另一个平台。创建或加入协作后,您可以从 AWS Glue Data Catalog 配置数据表。当您在协作中运行查询时,AWS Clean Rooms 会从其所在的位置读取数据,并自动应用限制来保护每个参与者的基础数据。对于每个表,您可以指定分析规则。这些规则可帮助您限制允许对数据进行的 SQL 查询类型。您还可以配置输出约束,例如最小聚合阈值。
完全编程访问
除了 AWS 管理控制台之外,所有的 AWS Clean Rooms 功能都可以通过 API 访问。您将能够使用 AWS SDK 或命令行界面 (CLI) 自动执行 AWS Clean Rooms 操作,将 Clean Rooms 功能集成到现有工作流程和产品中,或为您的客户创建您自己的洁净室版本。
受自动分析规则约束的灵活的 SQL 查询
创建或加入 AWS Clean Rooms 协作的人员可以编写查询来交叉和分析与协作关联的数据表,但须遵守每个参与者定义的限制,即分析规则。AWS Clean Rooms 控制支持两种类型的分析规则:列表分析规则和聚合分析规则。聚合查询将仅允许生成聚合统计信息的查询(例如,这两个数据集的交集有多大?)。列表查询将允许提取多个数据集交集的行级列表的查询(例如,这两个数据集的完整交集是什么?)。例如,您可以通过选择受支持的分析规则之一(如聚合)来选择允许的查询结构;选择允许其他协作者运行的统计信息,例如总和、计数或平均值。通过这些限制,您可以获得对数据使用方式的内置控制。
灵活的最小聚合阈值
最小聚合约束将允许您设置输出行返回的条件。这些约束采用 COUNT DISTINCT(列)>= 阈值的形式。如果查询结果中的输出行不符合该约束,则会自动编辑;这使您可以自动强制执行最小聚合阈值,同时让数据协作者可以灵活编写自己选择的查询。
加密计算
您可以对受加密保护的数据运行 AWS Clean Rooms 查询。如果您的数据处理策略要求对敏感数据进行加密,则可以使用特定于协作的共享加密密钥对数据进行预加密,以便在运行查询时也会加密数据。加密计算确保协作计算中使用的数据保持加密:静态、传输中和使用中(处理时)。
Clean Rooms 加密计算 (C3R) 是一个带有 CLI 的开源 Java SDK,现已在 GitHub 上提供。此功能不额外收费。如果您有大数据,可以查看文档,了解如何将 C3R 集成到 Apache Spark 中。
此功能是众多 AWS 加密计算工具中的最新功能,旨在帮助您满足安全性和合规性需求,同时让您能够利用 AWS 提供的灵活性、可扩展性、性能和易用性。