Amazon SageMaker 融通式合作开发工作室现已支持数据质量规则的编写与评估
发布于:
2026年5月20日
Amazon SageMaker 融通式合作开发工作室现已支持数据质量规则的编写与评估,并由 AWS Glue 数据质量自动监测功能提供支持。数据工程师、分析师和数据科学家可以直接在 SageMaker 融通式合作开发工作室中,针对目录表中的静态数据与可视化 ETL 作业中的传输中数据,定义数据质量规则、运行规则集评估并查看结果。这可助您在不良数据进入数据湖或影响下游分析与机器学习工作负载之前,及时发现数据质量问题。
通过此次发布,您可以借助 AWS Glue 数据质量自动监测功能中使用的数据质量定义语言(DQDL)来编写规则,并直接在 SageMaker 融通式合作开发工作室中跨两类工作流程执行评估。对于静态数据,可以利用目录资产上的专用“数据质量”选项卡,编写规则、执行按需或定期评估以及查看每条规则的详细通过/失败结果。对于传输中数据,可以向任意可视化 ETL 作业添加“评估数据质量”转换,并在运行详细信息中查看数据质量结果。您可以创建规则集来检查完整性、唯一性、新鲜度、准确性以及其他数据质量维度。
这项功能已在提供 Amazon SageMaker 融通式合作开发工作室的所有 AWS 区域推出,适用于基于 AWS IAM Identity Center 的域和基于 IAM 的域。要了解更多信息,请访问 Amazon SageMaker 融通式合作开发工作室文档。