게시된 날짜: Dec 8, 2020
오늘은 기계 학습 개발자가 훈련 데이터 및 모델의 가시성을 높여 바이어스를 식별 및 제한하고 예측을 설명하는 데 도움이 되는 Amazon SageMaker Clarify를 설명하겠습니다.
바이어스는 연령 또는 소득 계층처럼 여러 그룹 전반에서 예측의 정확성에 불균형이 있다는 것을 의미합니다. 바이어스는 모델 훈련에서 사용되는 데이터 또는 알고리즘으로 인해 발생할 수 있습니다. 예를 들어, 중년 개인에 대한 데이터를 기본으로 ML 모델을 훈련하는 경우 청년 및 고령층과 관련된 예측을 할 때 정확성이 떨어질 수 있습니다. 기계 학습 필드는 데이터 및 모델에서 바이어스를 감지 및 측정하여 해결할 수 있는 기회를 제공합니다. 그리고 모델의 해당 예측 이유를 설명하기 위해 모델 입력의 중요도를 살펴볼 수 있습니다.
Amazon SageMaker Clarify는 데이터 준비 작업 동안, 훈련 직후 그리고 지정한 속성을 조사함으로써 배포된 모델에서 잠재적인 바이어스를 감지합니다. 예를 들어, 초기 데이터 세트와 훈련 모델에서 나이와 관련된 바이어스를 확인하고 다른 유형의 가능한 바이어스를 정량화한 상세 보고서를 받을 수 있습니다. SageMaker Clarify에는 모델 예측을 설명하는 데 도움이 되는 피처 중요도 그래프가 포함되어 있으며 내부 프레젠테이션을 지원하거나 수정 조치를 취할 수 있도록 모델의 문제점을 식별하는 데 사용할 수 있는 보고서를 생성합니다.