发布于: Apr 7, 2021

AWS Glue 现提供对不完整数据集的缺失值插补。您可以使用“缺失值填充” transform 来获取数据列中空白项的预测值。凭借此功能,您可以轻松地清除具有 null 值或空值的数据集,从而在查询时无需考虑它们。

缺失值填充是 AWS Glue 中一个新的 ML Transform,它可以从您数据集的完整行中学习模式,并预测您所指定的列中缺失数据的值。它适用于表格数据集中的分类数据和数值数据,并使用传统和机器学习相结合的方法来生成完整的列,而 AWS Glue 会将其附加到您的数据集。开始使用“缺失值填充”的最简单方法,是从 AWS Glue Studio 的 tranform 列表中选择它。

“缺失值填充” transform 现已在与 AWS Glue 相同的 AWS 区域推出。

欲了解有关该功能的更多信息,请访问我们的参考文档AWS Glue Studio 文档