Amazon SageMaker를 사용한 ML 거버넌스

액세스 제어 간소화 및 투명성 향상

ML 거버넌스가 필요한 이유

Amazon SageMaker는 ML을 책임감 있게 구현하는 데 유용한 목적별 거버넌스 도구를 제공합니다. 관리자는 Amazon SageMaker Role Manager를 사용하여 최소 권한을 몇 분 만에 정의할 수 있습니다. Amazon SageMaker Model Cards를 사용하면 개념 단계부터 배포 단계에 이르기까지 전체 수명주기에서 용도, 위험 등급 및 훈련 세부 정보와 같은 필수 모델 정보를 보다 손쉽게 캡처하고 검색하고 공유할 수 있습니다. Amazon SageMaker Model Dashboard는 프로덕션 환경에서 모델의 동작에 대한 정보를 한곳에서 제공합니다. Amazon SageMaker와 Amazon DataZone을 통합하면 ML 및 데이터 거버넌스를 더 쉽게 간소화할 수 있습니다.

SageMaker ML 거버넌스의 이점

엔터프라이즈급 보안 제어를 통해 몇 분 만에 ML 개발 환경을 프로비저닝하여 프로젝트의 ML 및 데이터 자산에 대한 액세스를 관리합니다.
기계 학습(ML) 실무자가 더 빨리 SageMaker를 사용하여 작업을 시작할 수 있도록 사용자 지정된 역할을 생성합니다.
모델 문서를 간소화하고 개념 단계부터 배포 단계까지 주요 가정, 특성 및 아티팩트에 대한 가시성을 제공합니다.
통합 보기를 통해 모든 모델, 엔드포인트 및 모델 모니터링 작업의 성능을 신속하게 감사하고 문제를 해결합니다. 자동화된 알림을 통해 예상되는 모델 동작과 누락되거나 비활성화된 모니터링 작업의 편차를 추적합니다.

Amazon DataZone 통합

  • 제어 설정 및 프로비저닝
  • IT 관리자는 Amazon DataZone에서 회사와 사용 사례에 맞는 인프라 제어 및 권한을 정의할 수 있습니다. 그런 다음 몇 번의 클릭만으로 적절한 SageMaker 환경을 만들고 SageMaker Studio 내에서 개발 프로세스를 시작할 수 있습니다.

  • 자산 검색 및 발견
  • SageMaker Studio에서 조직의 비즈니스 카탈로그에 있는 데이터 및 ML 자산을 효율적으로 검색하고 검색할 수 있습니다. 프로젝트에 사용해야 하는 자산을 구독하여 해당 자산에 대한 액세스를 요청할 수도 있습니다.

  • 자산 사용
  • 구독 요청이 승인되면 JupyterLab 및 SageMaker Canvas를 사용하여 SageMaker Studio 내에서 데이터 준비, 모델 훈련, 특성 추출과 같은 ML 작업에 이러한 구독 자산을 사용할 수 있습니다.

  • 자산 게시
  • ML 작업을 완료한 후에는 데이터, 모델 및 특성 그룹을 비즈니스 카탈로그에 게시하여 다른 사용자의 거버넌스 및 검색 기능을 지원할 수 있습니다.

권한 정의

ML 활동에 대한 권한 간소화

SageMaker Role Manager는 사전 구축된 AWS Identity and Access Management(IAM) 정책 카탈로그를 통해 ML 활동 및 페르소나에 대한 기본 권한 집합을 제공합니다. ML 활동에는 데이터 준비와 훈련이 포함될 수 있으며, 페르소나에는 ML 엔지니어와 데이터 사이언티스트가 포함될 수 있습니다. 기준 권한을 유지하거나 특정한 요구 사항에 따라 추가로 사용자 지정할 수 있습니다.

권한을 간소화하는 역할 관리자

IAM 정책 생성 자동화

몇 가지 셀프 구성 화면을 통해 네트워크 액세스 경계, 암호화 키 등 일반적인 거버넌스 구성을 빠르게 입력할 수 있습니다. 그러면 SageMaker Role Manager가 IAM 정책을 자동으로 생성합니다. AWS IAM 콘솔을 통해 생성된 역할과 관련 정책을 검색할 수 있습니다.

관리형 정책 연결

사용 사례에 대한 권한을 추가로 사용자 지정하려면, SageMaker Role Manager에서 생성하는 IAM 역할에 관리형 IAM 정책을 연결합니다. 또한 AWS 서비스 전반에서 역할을 식별하고 구성하는 데 유용한 태그를 추가할 수 있습니다.

관리형 정책 연결

문서 간소화

모델 정보 캡처

SageMaker Model Cards는 Amazon SageMaker 콘솔에서 모델 정보를 저장하는 리포지토리로, ML을 책임감 있게 구현할 수 있도록 모델 문서를 중앙 집중화하고 표준화하는 데 도움이 됩니다. 입력 데이터 세트, 훈련 환경 및 훈련 결과와 같은 훈련 세부 정보를 자동으로 채워 문서화 프로세스를 가속화할 수 있습니다. 모델 목적 및 성능 목표와 같은 세부 정보를 추가할 수도 있습니다.

sagemaker 콘솔의 모델 정보

평가 결과 시각화

편향 및 품질 지표와 같은 모델 평가 결과를 모델 카드에 첨부하고, 차트와 같은 시각화 요소를 추가하여 모델 성능에 대한 주요 인사이트를 얻을 수 있습니다.

평가 결과를 시각화하는 모델 카드

모델 카드 공유

모델 카드를 PDF 형식으로 내보내 비즈니스 관계자, 내부 팀 또는 고객과 보다 손쉽게 공유할 수 있습니다.