AWS Clean Rooms 支持生成合成数据集以训练自定义机器学习模型

发布于: 2025年11月30日

如今,AWS Clean Rooms 可帮助您与合作伙伴基于双方的汇总数据生成隐私强化型合成数据集,用于训练回归与分类机器学习 (ML, Machine Learning) 模型。

合成数据集生成功能允许您与合作伙伴创建具有与原数据相似统计特性的训练数据集,而训练代码将完全无法触及任何真实数据记录。这项新功能可对原始数据中的对象(例如被收集数据的人员或实体对象)进行去标识化处理,从而降低模型记忆训练数据中个人信息的风险。该功能解锁了以往受隐私限制而无法开展的全新 ML 模型训练使用案例,例如营销活动优化、欺诈检测和医学研究。例如,某家拥有专有算法的航空公司希望与某酒店品牌合作,共同为高价值客户提供联合促销,但双方均不愿共享敏感的消费者数据。有了 AWS Clean Rooms ML,他们可基于汇总数据生成合成版本的数据集来训练模型,而不会暴露原始数据,此方法既能实现更精准的促销触达,又能保护客户隐私。

如需进一步了解 AWS Clean Rooms ML 已在哪些 AWS 区域上线,请参阅 AWS 区域表格。如需了解更多信息,请访问 AWS Clean Rooms ML