投稿日: Dec 8, 2020
本日、当社では Amazon SageMaker Clarify を導入することにより、機械学習デベロッパーがトレーニングデータとモデルの可視性を高めて、バイアスを特定して制限し、予測を説明できるようになりました。
バイアスは、年齢や所得階層など、さまざまなグループ間での予測精度における不均衡です。バイアスは、モデルのトレーニングに使用されたデータまたはアルゴリズムから発生する可能性があります。たとえば、ML モデルが主に中年の個人から得たデータでトレーニングされている場合、若年者や高齢者が関与する予測を行う際の精度が低下する可能性があります。機械学習の分野では、バイアスを検出し、データとモデルで測定することで、バイアスに対処する機会が提供されます。モデル入力の重要性を調べて、モデルが予測を行う理由を説明することもできます。
Amazon SageMaker Clarify は、指定した属性を調べることにより、データの準備中、トレーニング後、およびデプロイされたモデルで潜在的なバイアスを検出します。たとえば、初期データセットまたはトレーニング済みモデルで年齢に関連するバイアスを確認し、考えられるさまざまなタイプのバイアスを定量化する詳細レポートを受け取ることができます。SageMaker Clarify には、モデルの予測を説明し、内部プレゼンテーションをサポートしたり、修正するための手順を実行できるモデルの問題を特定したりするためのレポートを作成できる機能重要度グラフも含まれています。