亚马逊AWS官方博客

AWS Clean Rooms ML 可帮助客户和合作伙伴在不共享原始数据的情况下应用机器学习模型(预览版)



今天,我们将介绍 AWS Clean Rooms ML(预览版),这是 AWS Clean Rooms 的一项新功能,可帮助您和您的合作伙伴在集体数据上应用机器学习(ML)模型,而无需相互复制或共享原始数据。借助这一新功能,您可以使用机器学习模型生成预测性洞察信息,同时继续保护您的敏感数据。

在本预览版中,AWS Clean Rooms ML 推出了第一个专门帮助公司针对营销使用案例创建相似区段的模型。使用 AWS Clean Rooms ML 相似功能,您可以训练自己的自定义模型,还可以邀请合作伙伴携带少量记录样本进行协作,生成相似记录扩展集,同时保护每个人的基础数据。

未来几个月中,AWS Clean Rooms ML 将发布医疗保健模型。这将是 AWS Clean Rooms ML 明年将支持的众多模型中的第一个。

AWS Clean Rooms ML 可为您解锁各种机会,帮助您获得洞察信息。例如:

  • 航空公司可以收到有关忠实客户的信号,与在线预订服务合作,并向具有类似特征的用户提供促销活动。
  • 汽车贷款机构和汽车保险公司可以识别与一组现有租赁人具有相同特征的潜在汽车保险客户。
  • 品牌和出版商可以对市场中的相似客户群体进行建模,并提供高度相关的广告体验。
  • 研究机构和医院网络可以查找与现有临床试验参与者相似的候选人,从而加快临床研究(即将推出)。

AWS Clean Rooms ML 相似建模可帮助您应用 AWS 托管的即用型模型,这种模型通过每一次协作进行训练,只需点击几下即可生成相似数据集,从而省却数月的繁琐开发工作,无需您构建、训练、调整和部署自己的模型。

如何使用 AWS Clean Rooms ML 生成预测性见解
今天,我将展示如何使用 AWS Clean Rooms ML 中的相似建模,并假设您已经与合作伙伴建立了数据协作。如果您想学习具体做法,请查看 AWS Clean Rooms 现已正式上线 – 无需共享原始数据即可与您的合作伙伴协作文章。

您可以利用您在 AWS Clean Rooms 协作中的集体数据,与合作伙伴合作,应用机器学习相似建模来生成相似区段。其工作原理是从您的数据中提取一小部分代表性记录样本,创建机器学习(ML)模型,然后应用特定模型从您业务合作伙伴的数据中识别找出相似记录的扩展集。

以下屏幕截图展示了使用 AWS Clean Rooms ML 的整体工作流程。

有了 AWS Clean Rooms ML 的帮助,您无需自行构建复杂且耗时的机器学习模型。AWS Clean Rooms ML 可训练自定义私有机器学习模型,在保护数据的同时为您节省数月的时间。

无需共享数据
由于机器学习模型在服务中原生构建,因此您无需共享数据即可构建您的机器学习模型,AWS Clean Rooms ML 可帮助您保护数据集和客户信息。

您可以使用 AWS Glue Data Catalog 表指定训练数据集,该表包括用户项目交互。

您可以在要训练的其他列下,定义数值和类别数据。如果您需要向数据集添加更多特征,例如观看视频的秒数、文章主题或电子商务项目的产品类别,此功能会非常有用。

应用经过自定义训练的 AWS 构建模型
定义训练数据集后,您现在便可以创建相似模型。相似模型是一种机器学习模型,用于在合作伙伴数据集中查找相似配置文件,无需任何一方共享其基础数据。

创建相似模型时,您需要指定训练数据集。在单个训练数据集中,可以创建多个相似模型。您还可以使用相对范围绝对范围灵活定义训练数据集的日期窗口。如果您在 AWS Glue 中的数据不断更新(例如用户阅读的文章),此功能会非常有用。

易于调整的机器学习模型
创建相似模型后,您需要对其进行配置,以便在 AWS Clean Rooms 协作中使用。AWS Clean Rooms ML 提供灵活的控制功能,您和您的合作伙伴能够轻松调整应用的机器学习模型的结果,从而获得预测性洞察信息。

配置相似模型页面,可以选择要使用的相似模型并定义所需的最小匹配种子大小。此种子大小定义种子数据中与训练数据配置文件重叠的最小配置文件数量。

您还可以灵活选择协作中的合作伙伴是否收到与其他成员共享的指标中的指标。

妥善配置相似模型后,您现在便可以通过将配置好的相似模型与协作关联,向合作伙伴提供该机器学习模型。

创建相似区段
关联相似模型后,您的合作伙伴便可以选择创建相似区段,然后为您的协作选择关联的相似模型,随即开始生成洞察信息。

您的合作伙伴需要在创建相似区段页面上提供种子配置文件。种子配置文件示例包括您的顶级客户或购买特定产品的所有客户。生成的相似区段将包含训练数据中与种子配置文件最为相似的配置文件。

最后,您的合作伙伴将获得使用机器学习模型获得的相似区段的相关性指标。在这个阶段,您可以根据得分来做出决定。

导出数据并使用编程 API
您还可以选择导出相似区段数据。导出后,数据将以 JSON 格式保存,您可以通过与 AWS Clean Rooms API 和应用程序集成来处理此输出。

申请试用预览版
AWS Clean Rooms ML 现已通过 AWS Clean Rooms 在以下区域推出预览版:美国东部(俄亥俄州、弗吉尼亚州北部)、美国西部(俄勒冈州)、亚太地区(首尔、新加坡、悉尼、东京)和欧洲地区(法兰克福、爱尔兰、伦敦)。目前正在筹备对其他模型的支持。

访问 AWS Clean Rooms ML 页面,了解如何在不共享基础数据的情况下与合作伙伴一起应用机器学习。

祝您合作愉快!
– Donnie