Amazon SageMaker Clarify

检测机器学习数据和模型中的偏差并解释模型预测

解释输入特征如何为您的模型预测提供实时帮助

在数据准备期间、模型训练之后以及部署的模型中检测潜在的偏差

识别部署后偏差和特征重要性发生的任何变化

Amazon SageMaker Clarify 为机器学习(ML)开发人员提供专门构建的工具,以更深入地了解他们的 ML 训练数据和模型。Amazon Clarify 使用各种指标检测和测量潜在偏差,以便他们能够解决潜在偏差并解释模型预测。

Amazon SageMaker Clarify 可以在数据准备期间、模型训练之后以及部署的模型中检测潜在的偏差。例如,您可以检查数据集或经过训练的模型中是否存在与年龄相关的偏差,并接收详细报告,其中量化了不同类型的潜在偏差。SageMaker Clarify 还包括特征重要性评分,可帮助您解释模型如何做出预测,并通过在线可解释性批量或实时生成可解释性报告。您可以使用这些报告为客户或内部演示提供支持,或识别模型的潜在问题。

工作原理

检测数据和模型预测中的偏差

识别数据中的不平衡

SageMaker Clarify 使您能够在数据准备期间识别潜在的偏差,而无需编写自己的代码作为 SageMaker Data Wrangler 的一部分。 您可以指定输入特征,例如性别或年龄,随后 SageMaker Clarify 会运行分析任务来检测这些特征中的潜在偏差。然后,SageMaker Clarify 将提供一份可视化报告,其中描述了潜在偏差的指标和衡量方法,以便您确定纠正偏差的步骤。例如,在一个金融数据集中,与其他年龄组相比,某年龄组仅包含少数商业贷款示例,则偏差指标将指示不平衡,以便您能够解决数据集中的不平衡问题,并降低模型对于特定年龄组极不准确的风险

如果出现数据不平衡,您可以使用 SageMaker Data Wrangler 来进行平衡。SageMaker Data Wrangler 提供三种平衡运算符:随机欠采样、随机过采样和 SMOTE,以重新平衡不平衡数据集中的数据。在此处阅读我们的博客文章了解更多信息。

检查经过训练的模型有无偏差

模型训练完成后,您可以通过 SageMaker Experiments 运行 SageMaker Clarify 偏差分析来检查模型是否存在潜在偏差,例如某项预测对一组产生负面结果的频率高于对另一组产生负面结果的频率。您指定要测量模型结果偏差的输入特征(例如年龄),然后,SageMaker 将运行分析并为您提供可视化报告,识别每个特征的不同类型偏差,例如与较年轻的群体相比,年龄较大的群体是否获得了更积极的预测。

AWS 开源库 Fair Bayesian Optimization 可通过调整模型的超参数来帮助减小偏差。在此处阅读博客文章,了解如何应用 Fair Bayesian Optimization 以减小偏差,同时提高机器学习模型的准确性。

监控您的模型有无偏差

Amazon SageMaker Clarify 可帮助数据科学家和机器学习工程师定期监控偏差预测。如果训练数据与模型在部署期间发现的数据(即实时数据)不同,则部署的机器学习模型中可能会引入偏差或加剧偏差。例如,如果用于训练模型的抵押贷款利率与当前的抵押贷款利率不同,则用于预测房价的模型输出可能会出现偏差。SageMaker Clarify 偏差检测功能已集成到 SageMaker Model Monitor 中,因此,当 SageMaker 检测到超过特定阈值的偏差时,它会自动生成指标,您可以在 SageMaker Studio 中或通过 Amazon CloudWatch 指标和警报查看这些指标。

解释模型预测

了解哪些特征对模型预测贡献最大

SageMaker Clarify 与 SageMaker Experiments 集成,提供评分,以详细说明哪些特征对表格、NLP 及计算机视觉模型的特定输入的模型预测贡献最大。对于表格数据集,SageMaker Clarify 还可以输出聚合特征重要性图表,提供对模型整体预测过程的见解。这些详细信息有助于确定特定模型输入对整体模型行为的影响是否比预期的影响更大。对于表格数据,除特征重要性评分外,您还可以使用部分依赖图(PDP)来显示预测的目标响应与一组感兴趣的输入特征之间的依赖关系。

解释计算机视觉和 NLP 模型

SageMaker Clarify 还可以提供对计算机视觉和自然语言处理(NLP)模型的见解。对于视觉模型,SageMaker Clarify 使客户能够查看模型认为最重要的图像部分。对于 NLP 模型,SageMaker Clarify 会提供单词、句子或段落级别的特征重要性评分。

监控模型的行为变化

实时数据的变化可能会暴露模型的新行为。例如,在某个地理区域数据上训练的信用风险预测模型应用于另一个区域的数据时,可能会改变该模型对各种特征的重要性。Amazon SageMaker Clarify 与 SageMaker Model Monitor 集成,以在输入特征重要性改变并因此导致模型行为变化时,通过 Amazon CloudWatch 等警报系统提醒您。

实时解释单个模型预测

SageMaker Clarify 可以提供评分,详细说明在新数据上运行模型后,哪些特征对模型的单个预测贡献最大。这些详细信息有助于确定特定输入特征对模型预测的影响是否比预期的影响更大。您可以通过在线可解释性实时查看每个预测的详细信息,或者获取对所有单个预测进行批处理的批量报告。

使用案例

数据科学

数据科学家和机器学习工程师需要使用工具生成所需见解,以通过更高效的特征工程来调试和改进机器学习模型,从而确定模型是否基于干扰或不相关的特征进行推理,并了解模型的局限性以及模型可能出现的故障模式。

业务

AI 系统的采用需要透明。通过对经过训练的模型及其预测进行可靠解释,能够实现透明。对于某些要求可靠性、安全性和合规性的行业,例如金融服务、人力资源、医疗保健和自动化运输,模型可解释性可能至关重要。

合规性

公司可能需要解释某些决策,并围绕模型风险管理采取措施。Amazon SageMaker Clarify 可以帮助检测初始数据或模型在训练后存在的任何潜在偏差,并且还可以帮助解释哪些模型特征对机器学习模型的预测贡献最大。

客户

德甲联赛

由 AWS 提供支持的德甲赛况在足球比赛期间为全世界的德甲球迷提供了更吸引人的球迷体验。使用 Amazon SageMaker Clarify,德甲现在可以以交互式方式解释是哪些关键的基本组件决定了导致 ML 模型预测特定的 xGoals 值的因素。了解各自的功能属性和解释结果有助于模型调试和提高 ML 算法的可信度,从而得到更高质量的预测。

“Amazon SageMaker Clarify 与德甲赛况数字平台的其余部分无缝集成,是在 Amazon SageMaker 上标准化 ML 工作流的长期策略的关键部分。通过使用 AWS 的创新技术(例如机器学习)来提供更深入的见解,让球迷更好地理解球场上的瞬间决定,德甲赛况可以让观众更深入地了解每场比赛中的关键决定。”

德国足球职业联盟数字创新执行副总裁 Andreas Heyden

capcom

“AutoGluon 和 Amazon SageMaker Clarify 的结合使我们的客户流失模型能够以 94% 的准确率预测客户流失。SageMaker Clarify 通过 SHAP 值提供可解释性来帮助我们了解模型行为。通过 SageMaker Clarify,与本地计算相比,我们将 SHAP 值的计算成本降低了高达 50%。联合解决方案使我们能够更好地了解模型并以更高的准确率提高客户满意度,同时节省大量成本。”

CAPCOM 数据组主管 Masahiro Takamoto

DOMO

“Domo 提供了一套可扩展的数据科学解决方案,企业中的任何人都可以轻松使用和了解。借助 Clarify,我们的客户可以了解他们的 AI 模型如何进行预测。Clarify 与 Domo 的结合有助于为我们的客户提高 AI 速度和智能,为业务和生态系统中的每个人提供 AI 的强大功能。”

Domo AI 和数据科学主管 Ben Ainscough 博士

Varo

Varo Bank 是总部位于美国的数字化银行,该银行使用 AI/ML 帮助进行快速基于风险的决策,以向客户提供其创新产品和服务。

“Varo 对 ML 模型的可解释性和透明度投入很大,我们很高兴地看到 Amazon SageMaker Clarify 的结果在推动这些努力。”

Varo Money 数据科学主管 Sachin Shetty

Zopa
“Zopa 是一家英国数字银行和个人对个人借贷平台。在我们的机器学习应用程序(如欺诈检测应用程序)中,理解每个因素对模型决策的影响对我们来说很重要。了解模型的推理可以给予我们的内部和外部利益相关者信息。还可以帮助我们的运营团队更快地作出响应并为客户提供最好的服务。使用 Amazon SageMaker Clarify,我们现在可以更快、更无缝地生成模型解释。”
 

Jiahang Zhong,Zopa 的数据科学负责人

资源

视频

了解 ML 模型预测和偏差

网络研讨会

观看解释机器学习模型的 60 分钟网络研讨会

教程

按照分步说明操作

博客

了解 Amazon SageMaker Clarify 如何帮助检测偏差

示例笔记本

探索代码示例

开发人员指南

阅读技术文档

白皮书

深入了解偏差检测和模型可解释性

白皮书

金融 ML 的公平措施

新增内容

日期(最新到最老)
  • 日期(最新到最老)
1
未找到任何结果