发布于: Mar 30, 2022

AWS Glue 版本 2.0 现在支持 AWS Glue FindMatches 机器学习转换。AWS Glue FindMatches 可自动识别部分匹配的使用案例记录,包括关联客户记录、产品目录去重和欺诈侦测。使用 Glue 2.0,使用 FindMatches 执行模糊匹配的 ETL 任务将在一分钟后开始,最低计费 1 分钟。

使用 FindMatches 转换可以识别然后合并或复制您数据集中的相关记录。例如,它可以识别出记录是匹配项,无论是否有拼写和格式差异,如“John Doe”和“Jhn Doe”、“JOHN_DOE@ANYCOMPANY.COM”和“johndoe@anycompany.com”或者“555-010-0000”和“+1-555-010-0000”。

此功能在已推出 AWS Glue 的所有 AWS 区域开放。

要了解详情,请访问我们的文档并阅读 FindMatches 博客文章