AWS Clean Rooms 中的 PySpark 已推出
发布于:
2025年3月18日
今天,AWS 宣布正式推出 AWS Clean Rooms 中的 PySpark,使各公司及其合作伙伴能够使用 PySpark(适用于 Apache Spark 的 Python API)对大型数据集运行复杂的分析。通过此次发布,您和您的合作伙伴可以将 PySpark 代码和库引入 AWS Clean Rooms 进行协作,并运行高级分析,而无需共享底层数据或专有分析方法。例如,广告效果衡量提供商可以使用 AWS Clean Rooms 中的 PySpark,针对多个发布商数据集同时运行其自定义算法,以衡量广告效果。同样,制药公司可以在征得相应患者同意的情况下,针对多个医疗服务提供商数据集运行其专有算法和库,以评估临床试验中的药物依从性,而无需共享其专有数据。
AWS Clean Rooms 可以帮助公司及其合作伙伴更轻松地分析他们的汇总数据集并进行协作,而无需透露或复制彼此的底层数据。公司可以部署自己的洁净室,而无需构建、管理或维护自己的解决方案,也无需将数据移出其 AWS 环境。AWS Clean Rooms 中的 PySpark 已在这些 AWS 区域正式推出。要了解更多信息,请访问 AWS Clean Rooms。