亚马逊AWS官方博客

AWS Clean Rooms Differential Privacy 增强了对用户数据的隐私保护(预览版)



即日起,您将可以使用 AWS Clean Rooms Differential Privacy(预览版)。只需几个步骤,即可通过数学支持的直观控制来帮助保护用户隐私。作为 AWS Clean Rooms 的一项完全托管式功能,它可帮助您防止重新识别用户,而您无需具备差分隐私经验。

AWS Clean Rooms Differential Privacy 模糊了所有个体数据在协作中生成聚合洞察信息的具体贡献,因此您可以运行广泛的 SQL 查询以生成有关广告活动、投资决策、临床研究等的洞察信息。

差分隐私快速概览
差分隐私并不是什么新鲜事。它是一个强大的隐私数学定义,与基于统计学和机器学习的分析相兼容,已被美国人口普查局以及拥有大量数据的公司所采用。

差分隐私可帮助处理涉及大型数据集的各种使用案例。在这些使用案例中添加或删除少数个体对整体结果的影响很小,例如使用计数查询、直方图、基准测试、A/B 测试和机器学习进行人口分析。

下图显示了差分隐私应用于 SQL 查询时的工作原理。

分析师运行查询时,差分隐私会在运行时向查询结果中添加经过仔细校准的错误量(也称为“噪声”),从而掩盖个体贡献,同时仍保持查询结果足够准确,以提供有意义的洞察信息。噪声已经过仔细微调,可掩盖数据集中任何可能存在或不存在的个体。

差分隐私还包括另一个组成部分,即“隐私预算”。隐私预算是每次运行查询时消耗的有限资源,因此可以控制可在数据集上运行的查询次数,这有助于确保不会将噪声平均化,从而不会泄露任何个人隐私信息。隐私预算用尽后,除非增加或刷新,否则将无法再在表格上运行任何查询。

然而,差分隐私并不易于实现,因为要有效地应用这一技术,需要深入理解严格的数学公式和理论。配置差分隐私也是一项复杂的任务,因为客户需要计算出合适的噪声级别,以便在保护用户隐私的同时不对查询结果的效用产生负面影响。

客户还希望其合作伙伴能够进行各种分析,包括对其数据进行高度复杂的自定义查询。差分隐私很难支持这种需求,因为在处理聚合、联接和转换等各种查询组件时,校准噪声所涉及的计算性质错综复杂。

我们创建 AWS Clean Rooms Differential Privacy 后,只需点击几下即可通过数学支持的控制来帮助您保护用户隐私。

差分隐私在 AWS Clean Rooms 中的工作原理
虽然差分隐私是一项相当复杂的技术,但 AWS Clean Rooms Differential Privacy 可让您轻松应用差分隐私,并通过采用数学支持、灵活而直观的控制来保护用户隐私。作为具有数据贡献能力的成员启动或加入 AWS Clean Rooms 协作后,您只需几个步骤即可开始使用它。

您可以创建一个配置表(该表是对您在 AWS Glue Data Catalog 中的表的引用),并选择在向配置的表中添加自定义分析规则时启用差分隐私。

接下来,将配置的表关联到您的 AWS Clean Rooms 协作,并在协作中配置差分隐私策略,以使您的表可供查询。您可以使用默认策略来快速完成设置,也可以对其进行自定义设置,来满足您的特定要求。在此步骤中,您将配置以下内容:

隐私预算
隐私预算被量化为一个值,我们称之为 epsilon,它控制着隐私保护的程度。这是一种常见的有限资源,适用于协作中受差分隐私保护的所有表,因为其目标是保护用户隐私,而这些用户的信息可能存在于多个表中。每次在表上运行查询时,都会消耗隐私预算。您可以在协作期间随时灵活地增加隐私预算值,并在每个日历月自动刷新。

每次查询增加的噪声
该输入参数以您想要隐藏其贡献的用户数量来衡量,它控制着隐私预算的耗尽速度。

一般而言,您需要在隐私需求与您希望允许的查询次数以及这些查询的准确性之间取得平衡。AWS Clean Rooms 可帮助您了解最终向合作伙伴提供的结果效用,从而使您轻松完成这一步骤。您还可以使用交互式示例来了解所选设置对不同类型 SQL 查询结果的影响。

现在,您已经成功为数据启用了差分隐私保护,让我们来看看 AWS Clean Rooms Differential Privacy 的实际操作吧。在本演示中,假设我是您在 AWS Clean Rooms 协作中的合作伙伴。

在这里,我正在运行一个查询来计算重叠客户的数量,结果显示 tv.customer_id 有 3227643 个值。

现在,如果我在从 coffee_customers 表中删除有关某个个体的记录后再次运行同样的查询,它会显示不同的结果:3227604 个 tv.customer_id。查询结果中的这种可变性使我无法通过观察查询结果中的差异来识别个体。

我还可以看到差分隐私的影响,包括我可以运行的剩余查询。

预览版已发布
加入此预览版试用,并开始使用 AWS Clean Rooms Differential Privacy 来保护用户隐私。在此预览版试用期间,只要 AWS Clean Rooms 可用,您即可使用 AWS Clean Rooms Differential Privacy。要了解有关如何开始使用的更多信息,请访问 AWS Clean Rooms Differential Privacy 页面。

祝您合作愉快!
Donnie