发布于: Dec 8, 2020
今天,我们推出了 Amazon SageMaker Clarify,帮助机器学习开发人员进一步掌控训练数据和模型,从而识别和限制偏差并解释做出相关预测的原因。
偏差是指对不同群体(如年龄或收入阶层)进行预测时准确性表现出的失衡。偏差可能是由训练模型所用的数据或算法导致的。例如,如果一个 ML 模型主要使用中年个体相关数据进行训练,那么在涉及年轻人和老年人的预测时,其准确性可能会降低。机器学习领域提供了一个机会,可以通过在您的数据和模型中检测并衡量它们来消除偏差。您还可以查看模型输入的重要程度,以解释模型做出相关预测的原因。
Amazon SageMaker Clarify 会在数据准备期间、训练完成后和部署的模型中,通过检查您指定的属性来检测可能存在的偏差。例如,您可以检查初始数据集或训练后的模型中是否存在与年龄相关的偏差,并接收详细报告,其中量化了可能存在的、不同类型的偏差。SageMaker Clarify 还包含功能重要性图形,可帮助您解释模型做出相关预测的原因,并生成用于支持内部演示或识别模型问题的报告,以便您采取措施纠正相应问题。