- 分析›
- AWS Clean Rooms›
- 功能
AWS Clean Rooms 的功能
在几分钟内即可创建洁净室。无需共享原始数据,即可与合作伙伴协作
为什么选择 AWS Clean Rooms?
创建您自己的洁净室,添加参与者,然后只需几个步骤即可开始协作
无需共享或透露基础数据即可与任何公司协作
使用一系列针对洁净室的隐私增强控件来保护基础数据
关联和匹配客户记录,使用灵活的分析工具,并与合作伙伴一起训练和部署机器学习模型
页面主题
多方
全部打开就地展开数据协作
全部打开完全编程访问权限
全部打开可配置角色
全部打开在 AWS Clean Rooms 上的 AWS Entity Resolution 数据匹配服务
全部打开PySpark
全部打开灵活的 SQL
全部打开分析规则是指允许您对如何分析数据进行内置控制的限制。以指定查询运行者身份创建或加入协作的协作成员可以编写查询以交叉和分析您的数据表,但须遵守您设置的分析规则。AWS Clean Rooms 支持三种类型的分析规则:聚合、列表和自定义。
聚合分析规则:聚合分析规则允许您运行可生成聚合统计数据的查询,例如两个数据集的交集有多大。使用聚合分析规则时,您可以强制规定只能对您的数据运行聚合查询,并对所运行查询的特定部分实施限制,例如哪些列只能在随机匹配中使用,哪些列可用于总和、计数或平均值等聚合。您还可以控制输出中的最小聚合约束。 您还可以通过设置最小聚合约束来设置输出行返回的条件。这些约束采用 COUNT DISTINCT(列)>= 阈值的形式。如果查询结果中的输出行不符合任何约束条件,则会将其从结果集移除。这使您能够确保自动强制实施最小聚合阈值,同时为可以编写自己选择的查询的数据协作者提供灵活性。
列表分析规则:列表分析规则允许您运行查询,以提取多个数据集交集(例如两个数据集的重叠部分)的行级列表。使用列表分析规则时,您可以强制规定只能对您的数据运行列表查询,并对运行的查询实施限制,例如哪些列只能在随机匹配中使用,哪些列可以在输出中作为列表输出。
自定义分析规则:自定义分析规则允许您使用大多数符合 ANSI 标准的 SQL [例如公用表表达式(CTE)和开窗函数] 创建自定义查询。您还可以在协作合作伙伴运行查询之前查看和允许查询,并在允许其他协作者在您的表格上运行之前先对其进行审核。使用自定义分析规则时,您可以使用内置控制来预先确定或限制基础数据的分析方式,而不必在分析完成后依赖查询日志。使用自定义 SQL 查询时,您还可以创建或使用分析模板,以在协作中存储带有参数的自定义查询。这样客户能够更轻松地在协作中互相帮助。例如,具有较多 SQL 经验的成员可以创建模板供其他成员查看和运行。它还有助于在协作中进行可重复使用的分析。您还可以通过选择自定义分析规则,然后配置差异化隐私参数来使用 AWS Clean Rooms Differential Privacy 差异化隐私管控功能。
您可以对受加密保护的数据运行 AWS Clean Rooms 查询。如果您的数据处理策略要求对敏感数据进行加密,则可以使用特定于协作的共享加密密钥对数据进行预加密,以便在运行查询时也会加密数据。密态计算确保协作计算中使用的数据在静态、传输中和使用中(处理时)保持加密。
Clean Rooms 密态计算(C3R)是一个带有 CLI 的开源 Java SDK,现已在 GitHub 上提供。此功能不额外收费。如果您有大数据,可以查看文档,了解如何将 C3R 集成到 Apache Spark 中。
此功能是众多 AWS 密态计算工具中的最新功能,旨在帮助您满足安全性和合规性的需求,同时让您能够利用 AWS 提供的灵活性、可扩展性、性能和易用性。
增强隐私的 ML
全部打开AWS Clean Rooms ML 可帮助您和您的合作伙伴应用增强隐私的机器学习(ML)来生成预测性洞察,而无需彼此共享原始数据。AWS Clean Rooms ML 支持自定义和相似机器学习(ML)建模。借助自定义建模,您就可以提供自定义模型,以便进行训练并对集体数据集运行推理,而无需在协作者之间共享基础数据或知识产权。借助相似建模,您就可以使用 AWS 制作的模型,根据合作伙伴为协作提供的少量配置文件样本来生成一组扩展的相似配置文件。
AWS Clean Rooms ML 可帮助客户处理多种应用场景。例如,广告商可以提供他们的专有模型和数据进行 Clean Rooms 协作,并邀请发布者也提供他们的数据来训练和部署自定义 ML 模型,以帮助他们提高推广活动有效性;金融机构可以使用历史交易记录训练自定义 ML 模型,并邀请合作伙伴进行 Clean Rooms 协作以检测潜在的欺诈性交易;研究机构和医院网络可以找到与现有临床试验参与者相似的候选人,以帮助加快临床研究;品牌和发布者可以对市场中相似的客户群体进行建模,并提供高度相关的广告体验,而无需任何一家公司与他人共享基础数据。
AWS Clean Rooms ML 相似建模使用 AWS 制作的模型,以电子商务和流式传输视频等各种数据集为基础进行构建和测试,与具有代表性的行业基准相比,其可以帮助您将相似建模的准确性提高多达 36%。在诸如寻找新客户之类的现实应用中,提高准确性可以转化为节省数百万美元。
使用 AWS Clean Rooms,您和您的合作伙伴就能够根据您的集体数据生成合成数据集,用于训练回归和分类机器学习(ML)模型。AWS Clean Rooms ML 应用增强隐私的控制措施来帮助保护您的专有数据和 ML 模型,同时生成预测性洞察。作为增强隐私的控制措施,生成合成数据集使您和您的合作伙伴能够创建具有与原始数据类似统计属性的训练数据集,从而为以前受数据隐私问题限制的集体数据集解锁新的 ML 模型训练使用案例。
在 AWS Clean Rooms ML 中生成用于自定义机器学习的隐私增强型合成数据集的工作原理是去识别化原始数据中的主体(例如收集数据的人员或实体对象),从而降低模型记住数据集中个人信息的风险。合成数据集生成过程经过优化,可创建与您选择的回归和分类算法兼容的数据集。