Amazon SageMaker Clarify

ML モデルのバイアスを検出し、モデルの予測を理解する

Amazon SageMaker Clarify を導入することにより、機械学習デベロッパーは、トレーニングデータとモデルの可視性を高めて、バイアスを特定して制限し、予測を説明できるようになりました。

バイアスは、年齢や収入層など、さまざまなグループ間でのトレーニングデータまたはモデルの予測動作における不均衡です。 バイアスは、モデルのトレーニングに使用されたデータまたはアルゴリズムから発生する可能性があります。たとえば、ML モデルが主に中年の個人から得たデータでトレーニングされている場合、若年者や高齢者が関与する予測を行う際の精度が低下する可能性があります。機械学習の分野では、バイアスを検出し、データとモデルで測定することで、バイアスに対処する機会が提供されます。モデル入力の重要度を調べて、モデルが予測を行う理由を説明することもできます。

Amazon SageMaker Clarify は、指定した属性を調べることにより、データの準備中、モデルトレーニング後、およびデプロイされたモデルで潜在的なバイアスを検出します。例えば、初期データセットまたはトレーニングされたモデルで年齢に関連するバイアスを確認し、考えられるさまざまなタイプのバイアスを定量化する詳細レポートを受け取ることができます。SageMaker Clarify には、モデルの予測を説明し、内部プレゼンテーションをサポートしたり、修正するための手順を実行できるモデルの問題を特定したりするためのレポートを作成できる特長の重要度グラフも含まれています。

Amazon SageMaker Clarify で機械学習モデルの予測とバイアスを理解する (24:08)

データとモデルのバイアスを検出する

データの不均衡を特定する

SageMaker Clarify は Amazon SageMaker Data Wrangler と統合されているため、データ準備中のバイアスを簡単に特定できます。性別や年齢などの関心のある属性を指定すると、SageMaker Clarify は一連のアルゴリズムを実行して、これらの属性にバイアスが存在するかどうかを検出します。アルゴリズムの実行後、SageMaker Clarify は、存在し得るバイアスの原因と対策の説明を含む視覚的なレポートを提供するため、バイアスを修正する手順を特定できます。例えば、ある年齢層に対するビジネスローンの例の数が他の年齢層と比較してわずかである財務データセットでは、SageMaker はその不均衡にフラグを立てて、その年齢層を忌避するモデルを回避できるようにします。

トレーニングされたモデルのバイアスを確認する

トレーニングされたモデルのバイアスを確認することもできます。例えば、あるグループについて、別のグループよりも頻繁に否定的な結果を生成する予測などです。SageMaker Clarify は SageMaker Experiments と統合されているため、モデルのトレーニング後に、年齢などのバイアスをチェックする属性を特定できます。SageMaker は、トレーニングされたモデルをチェックするための一連のアルゴリズムを実行し、年齢層の高いグループが年齢層の低いグループと比較してより肯定的な予測を受け取るかどうかなど、各属性のさまざまな種類のバイアスを識別する視覚的なレポートを提供します。

モデルのバイアスをモニタリングする

初期のデータまたはモデルにはバイアスがかかっていない可能性がありますが、環境の変化により、既にトレーニングされているモデルにバイアスが生じる可能性があります。例えば、住宅購入者の人口統計における大幅な変化は、特定のグループが存在しないか、元のトレーニングデータに正確に表されていない場合、住宅ローン申請モデルにバイアスを生じさせる可能性があります。SageMaker Clarify は SageMaker Model Monitor と統合されており、モデルが特定のバイアスメトリクスのしきい値を超えた場合に通知するように Amazon CloudWatch などのアラートシステムを設定できます。 

モデルの動作を説明する

モデルを理解する

トレーニングされたモデルは、予測を生成する際に、一部のモデル入力を他のモデル入力よりも強く考慮する場合があります。例えば、ローン申請モデルは、他の要因よりも信用履歴を重視する場合があります。SageMaker Clarify は SageMaker Experiments と統合されており、モデルのトレーニング後にモデルの全体的な予測作成プロセスに最も貢献した特徴の詳細を示すグラフを提供します。これらの詳細は、コンプライアンス要件に役立つ場合があります。または、特定のモデル入力がモデル全体の動作に必要以上の影響を与えるかどうかを判断するのに役立ちます。

動作の変化についてモデルをモニタリングする

実際のデータが変化すると、モデルがモデル入力に異なる重みを与え、時間の経過とともにその動作が変化する可能性があります。例えば、住宅価格の下落により、モデルがローンの予測を行う際に収入をそれほど重視しなくなる可能性があります。Amazon SageMaker Clarify は SageMaker Model Monitor と統合されており、モデル入力の重要度が変化してモデルの動作が変化した場合にアラートを発します。

個々のモデルの予測を説明する

お客様と内部の利害関係者はどちらも、モデルが予測を行う方法についての透明性を望んでいます。SageMaker Clarify は SageMaker Experiments と統合して、特定の予測に対する各モデル入力の重要度を示します。モデルの予測に基づいて意思決定を行う際にモデルの動作を理解できるように、顧客対応を行う従業員が結果を利用できるようにすることができます。

ユースケース

規制コンプライアンス

Equal Credit Opportunity Act (ECOA) や Fairness in Housing Act などの規制により、企業が財務上の決定を説明することができる状態となっていること、およびモデルリスク管理に関する措置を講じることを求められる場合があります。Amazon SageMaker Clarify は、初期データまたはトレーニング後のモデルに存在する潜在的なバイアスにフラグを立てるのに役立つほか、ML モデルの予測に最も貢献したモデルの特徴を説明するのにも役立ちます。

内部報告とコンプライアンス

データサイエンスチームは、内部監査人や経営幹部などの内部の利害関係者に対して、ML モデルについて弁明または説明する必要があることがよくあります。Amazon SageMaker Clarify は、リクエストに応じてデータサイエンスチームに特徴の重要度のグラフを提供し、ML モデルの潜在的なバイアスまたは内部要件をサポートするために必要な追加情報を提供するためにモデルのトレーニングに使用されるデータを定量化するのに役立ちます。

カスタマーサービス

ファイナンシャルアドバイザーやローンオフィサーなどの顧客対応を行う従業員は、業務の過程で ML モデルによって行われた予測を確認できます。これらの従業員は、データサイエンスチームと協力して、API を介して Amazon SageMaker Clarify から直接視覚的なレポートを取得し、顧客に影響を与える可能性のある意思決定を行う前に特定の予測を確認するために、当該予測における最も重要な特徴の詳細を確認できます。

お客様

Varo_Logo

米国を拠点とするデジタル銀行である Varo Bank は、革新的な製品とサービスを顧客に提供するためのリスクベースの迅速な意思決定に AI/ML を役立てています。

「Varo は ML モデルの説明性と透明性を高く保つことを重視しており、Amazon SageMaker Clarify によりこれらの取り組みが推進されたことは素晴らしいことです」

Sachin Shetty 氏、Head of Data Science、Varo Money

Bundesliga_Logo

Bundesliga Match Facts powered by AWS は、世界中のブンデスリーガファンに対して、サッカーの試合中により魅力的なファン体験を提供します。Amazon SageMaker Clarify を使用することで、ブンデスリーガは、ML モデルが特定の xGoals 値を予測する原因を決定する際に、主要な基盤となるコンポーネントのいくつかが何であるのかをインタラクティブに説明できるようになりました。それぞれの特徴の属性を知り、結果を説明することは、モデルのデバッグと ML アルゴリズムの信頼性の向上に役立ち、より高品質の予測を得ることを可能にします。

「Amazon SageMaker Clarify は、他の Bundesliga Match Facts デジタルプラットフォームとシームレスに統合されており、Amazon SageMaker で ML ワークフローを標準化するという私たちの長期戦略における重要な部分となっています。機械学習などの AWS の革新的なテクノロジーを使用して、より詳細な洞察を提供し、ピッチにおいて一瞬のうちに行われる意思決定をファンに理解してもらうことで、Bundesliga Match Facts は視聴者が各試合における重要な意思決定についてより深い洞察を得ることができるようにします」

Andreas Heyden 氏、Executive Vice President of Digital Innovations for the DFL Group

Zopa_Logo
「Zopa は英国を拠点とするデジタル銀行であり、ソーシャルレンディングを行っています。不正検出アプリケーションなどの当社の機械学習アプリケーションでは、各要素がモデルの意思決定にどのように寄与するかを理解することが重要です。モデルの推論を可視化することで、内部と外部の両方の利害関係者のモデルに対する信頼を高めることができます。また、運用チームがより迅速に対応し、お客様により優れたサービスを提供するのにも役立ちます。Amazon SageMaker Clarify を使用することで、モデルの説明をより迅速かつシームレスに作成できるようになりました」

Jiahang Zhong 氏、Head of Data Science、Zopa

Amazon SageMaker Clarify のリソース

Amazon SageMaker Clarify の使用を開始する