发布于: Aug 9, 2019

您现在可以使用 AWS Glue 的全新 FindMatches ML 转换(一种自定义机器学习转换功能,可帮助您找出匹配记录)查找数据集中的匹配记录(包括无标识符的记录)。通过将 FindMatches 转换添加到 Glue ETL 作业中,您可以查找相关产品、位置、供应商和客户等。

您还可以使用 FindMatches 转换删除重复数据,例如识别多次注册的客户和无意间多次添加到产品目录中的产品等。您可以通过示例训练 FindMatches ML 转换了解您定义的“重复”。它会利用机器学习识别数据集中其他可能的重复数据。

AWS Glue ML 转换将率先在以下 AWS 区域推出:美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(俄勒冈)、欧洲(爱尔兰)和亚太地区(东京)。

要了解有关此功能的更多信息,请访问我们的文档