AWS Clean Rooms 是一项服务,可以让您和您的合作伙伴更轻松地分析和协作处理集体数据集,从而获得见解,而无需共享或复制彼此的基础数据,也不必将其移出 AWS。您可以使用 AWS Clean Rooms 在几分钟内创建自己的洁净室,然后只需单击几下即可开始分析您的集体数据集。在 AWS 管理控制台中或借助 API,您可以邀请任何您想要与之合作的 AWS 客户,选择数据集,并为参与者配置限制。借助 AWS Clean Rooms,您可以与已经在使用 AWS 的数十万家公司协作,而无需在您的 AWS 环境之外维护您的数据副本或将其加载到另一个平台。当您运行查询时,AWS Clean Rooms 会在其所在的位置读取数据,并应用分析规则来帮助您保持对数据的控制。AWS Clean Rooms 提供了一套广泛的隐私增强控制,包括查询控制、查询输出限制和查询日志记录,允许您自定义对每个净室参与者运行的查询的限制。AWS Clean Rooms 还包括高级加密计算工具,即使在处理查询时也能保持数据加密,以符合严格的数据处理策略。
关键产品功能
多方(最多五个数据协作者)
借助 AWS Clean Rooms,您可以在一次协作中与多达四个其他方分析数据。您可以安全地从多个公司生成见解,而无需编写代码。您可以创建洁净室,邀请您希望与之协作的公司,并选择哪些参与者可以在协作中运行分析。
无需在 AWS 环境之外维护数据副本即可进行协作
借助 AWS Clean Rooms,您可以轻松地与已经在使用 AWS 的数十万家公司协作,而无需在您的 AWS 环境之外维护您的数据副本或将其加载到另一个平台。创建或加入协作后,您可以从 AWS Glue Data Catalog 配置数据表。当您在协作中运行查询时,AWS Clean Rooms 会从其所在的位置读取数据,并自动应用限制来保护每个参与者的基础数据。对于每个表,您可以指定分析规则。这些规则可帮助您限制允许对数据进行的 SQL 查询类型。您还可以配置输出约束,例如最小聚合阈值。
完全编程访问
除了 AWS 管理控制台之外,所有的 AWS Clean Rooms 功能都可以通过 API 访问。您将能够使用 AWS SDK 或命令行界面(CLI)自动执行 AWS Clean Rooms 操作,将 Clean Rooms 功能集成到现有工作流程和产品中,或为您的客户创建您自己的洁净室版本。
受分析规则约束的灵活的 SQL 查询
分析规则是允许您对如何分析数据进行内置控制的限制。以指定查询运行者身份创建或加入协作的协作成员可以编写查询以交叉和分析您的数据表,但须遵守您设置的分析规则。AWS Clean Rooms 控制支持三种类型的分析规则:列表、聚合和自定义。
聚合分析规则:聚合分析规则允许您运行生成聚合统计数据的查询,例如两个数据集的交集有多大。使用聚合分析规则时,您可以强制规定只能对您的数据运行聚合查询,并对所运行查询的特定部分实施限制,例如哪些列只能在随机匹配中使用,哪些列可用于总和、计数或平均值等聚合。您还可以控制输出中的最小聚合约束。
列表分析规则:列表分析规则允许您运行查询,以提取多个数据集交集(例如两个数据集的重叠部分)的行级列表。使用列表分析规则时,您可以强制只能对您的数据运行列表查询,并对运行的查询实施限制,例如哪些列只能在随机匹配中使用,哪些列可以在输出中作为列表输出。
自定义分析规则:自定义分析规则允许您使用大多数 ANSI 标准 SQL(例如公用表表达式(CTE)和窗口函数)创建自定义查询,也可以在协作伙伴运行查询之前审查和允许查询,并在允许其他协作者的查询在您的表上运行之前对其进行审查。使用自定义分析规则时,您可以使用内置控制来预先确定或限制基础数据的分析方式,而不必在分析完成后依赖查询日志。使用自定义 SQL 查询时,您还可以创建或使用分析模板,以在协作中存储带有参数的自定义查询。这使客户能够更轻松地在协作中互相帮助,例如,SQL 经验更丰富的成员可以创建模板供其他成员查看并进行可能的运行。它还有助于在协作中进行可重复使用的分析。
无需编写 SQL 代码即可生成查询
借助 Analysis Builder,业务用户无需编写或理解 SQL,只需几个简单的步骤即可获得见解。您可以按照引导式用户界面中的步骤,根据自动建议的标准(例如与您的集体数据集相关的指标、区段和筛选器)构建符合每个协作者在其表格上设置的数据限制的查询。在一个或两个表配置了聚合或列表分析规则的协作中使用 Analysis Builder。
灵活的最小聚合阈值
最小聚合约束将允许您设置输出行返回的条件。这些约束采用 COUNT DISTINCT(列)>= 阈值的形式。如果查询结果中的输出行不符合该约束,则会自动编辑;这使您可以自动强制执行最小聚合阈值,同时让数据协作者可以灵活编写自己选择的查询。
加密计算
您可以对受加密保护的数据运行 AWS Clean Rooms 查询。如果您的数据处理策略要求对敏感数据进行加密,则可以使用特定于协作的共享加密密钥对数据进行预加密,以便在运行查询时也会加密数据。加密计算确保协作计算中使用的数据保持加密:静态、传输中和使用中(处理时)。
Clean Rooms 加密计算 (C3R) 是一个带有 CLI 的开源 Java SDK,现已在 GitHub 上提供。此功能不额外收费。如果您有大数据,可以查看文档,了解如何将 C3R 集成到 Apache Spark 中。
此功能是众多 AWS 加密计算工具中的最新功能,旨在帮助您满足安全性和合规性需求,同时让您能够利用 AWS 提供的灵活性、可扩展性、性能和易用性。