Amazon SageMaker 데이터 레이블 지정

기계 학습 모델의 훈련을 위한 고품질 데이터 집합 생성

Amazon SageMaker는 Amazon SageMaker Ground Truth Plus 및 Amazon SageMaker Ground Truth라는 두 가지 데이터 레이블 지정 제품을 제공합니다. 두 옵션 모두 이미지, 텍스트 파일 및 비디오와 같은 원시 데이터를 식별하고 정보 레이블을 추가하여 기계 학습 모델을 위한 고품질 훈련 데이터 집합을 생성할 수 있습니다.

Amazon SageMaker Ground Truth Plus

SageMaker Ground Truth Plus를 사용하면 레이블 지정 애플리케이션을 구축하거나 레이블 지정 인력을 직접 관리할 필요 없이 고품질 훈련 데이터 집합을 쉽게 생성할 수 있습니다. Amazon SageMaker Ground Truth Plus를 사용하여 데이터 레이블 지정 비용을 40%까지 절감할 수 있습니다. Amazon SageMaker Ground Truth Plus에서는 기계 학습 태스크에 대해 훈련된 전문가 인력을 제공하며, 이를 통해 데이터 보안, 개인 정보 보호 및 규정 준수 요구 사항을 충족할 수 있습니다. 단순히 데이터를 업로드하기만 하면, Amazon SageMaker Ground Truth Plus에서 사용자를 대신하여, 데이터 레이블 지정 워크플로를 생성하고 워크플로를 관리합니다.

Amazon SageMaker Ground Truth

데이터 레이블 지정 워크플로를 탄력적으로 구축하고 관리하며 자체 데이터 레이블 지정 인력을 관리하길 원한다면 Amazon SageMaker Ground Truth를 사용해보세요. SageMaker Ground Truth는 쉽게 데이터에 레이블을 지정하고 Amazon Mechanical Turk, 서드 파티 공급 업체 또는 자체 프라이빗 인력을 통해 사내 주석 담당자를 사용하는 옵션을 제공하는 데이터 레이블 지정 서비스입니다.

작동 방식

  • SageMaker Ground Truth Plus를 사용하여 데이터 레이블 지정
  • SageMaker Ground Truth를 사용하여 데이터 레이블 지정
  • 기능 비교
  • SageMaker Ground Truth Plus를 사용하여 데이터 레이블 지정
  • Amazon SageMaker Ground Truth Plus를 사용하면 레이블 지정 애플리케이션을 구축하거나 레이블 지정 인력을 관리할 필요 없이 고품질 훈련 데이터 집합을 생성할 수 있습니다.

    Amazon SageMaker Ground Truth Plus 작동 방식
  • SageMaker Ground Truth를 사용하여 데이터 레이블 지정
  • Amazon SageMaker Ground Truth는 자체 데이터 레이블 지정 워크플로 및 데이터 레이블 지정 인력을 구축하고 관리하는 데 도움이 됩니다.

    Amazon SageMaker Ground Truth의 작동 방식
  • 기능 비교
  • 범주 Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus
    데이터 레이블 지정 워크플로 텍스트, 이미지, 동영상 및 3D 포인트 클라우드에 대한 사용자 지정 또는 30개가 넘는 기본 제공 워크플로를 지원합니다. 데이터 레이블 지정 워크플로 및 데이터 레이블 지정 품질 관리 AWS 전문가가 사용자의 품질 및 소요 시간 요구 사항에 따라 사용자를 대신하여, 워크플로를 설정하고 관리합니다.
    사용자 데이터 사이언티스트 및 기계 학습 엔지니어 데이터 사이언티스트, 기계 학습 엔지니어, 데이터 작업 관리자, 프로그램 관리자
    인력 옵션: 서드 파티 공급 업체, Amazon Mechanical Turk 또는 자체 프라이빗 인력 데이터 보안, 개인 정보 보호 및 규정 준수 요구 사항을 충족하는 데 도움이 되는 전문 인력 
    기계 학습 레이블 지정 기술  적극적 학습  적극적 학습, 사전 레이블 지정 및 기계 검증 

이점

훈련 데이터 집합 품질 개선

Amazon SageMaker 데이터 레이블 지정 제품 및 서비스에서는 훈련 데이터 집합의 품질을 개선하는 데 도움이 되며 인적 오류를 줄여주는 기계 학습 레이블 지정 기술을 제공합니다. Amazon SageMaker Ground Truth Plus에서는 사전 레이블 지정, 오류 및 낮은 품질의 레이블을 탐지하기 위해 사람이 지정한 레이블의 기계 검증, 보조 레이블 지정 기능(예: 3D 입방체 스냅핑, 비디오 레이블 지정의 다음 프레임 예측, 자동 세그먼트 도구)을 포함하는 다단계 레이블 지정 워크플로를 지원합니다. 자체적인 데이터 레이블 지정 워크플로를 관리하고 있는 경우 SageMaker Ground Truth에서는 자동화된 레이블 지정 기능(예: 자동 세그먼트, 자동 3D 입방체 스냅핑, 2D 비디오 프레임에서 센서 융합)을 제공합니다.  또한, SageMaker Ground Truth에서는 적극적 학습을 사용하고 모델에서 자신있게 레이블을 지정할 수 없는 경우에만 사용자에게 레이블이 지정된 데이터를 연결하는 자동 데이터 레이블 지정 기능을 제공합니다.

데이터 레이블 지정 인력 선택

Amazon SageMaker 데이터 레이블 지정 제품 및 서비스를 통해 데이터 레이블 지정 인력을 선택할 수 있습니다. SageMaker Ground Truth Plus를 사용하면 기계 학습 태스크에서 훈련을 받은 전문 인력이 사용자의 품질 및 소요 시간 요구 사항에 따라 데이터에 레이블을 지정합니다. SageMaker Ground Truth를 사용하면 조직 안팎의 레이블러와 함께 협력할 수 있는 옵션을 제공합니다. 레이블 지정 작업을 자체 레이블러에게 손쉽게 전송할 수도 있고, 이미 Amazon Mechanical Turk를 통해 기계 학습 관련 작업을 수행하고 있는 500,000명이 넘는 독립 계약업체 인력도 이용할 수 있습니다. 데이터에 기밀성 또는 특수한 기술이 요구되는 경우에는 AWS에서 사전 선별한 공급 업체를 이용하여 품질 및 보안 절차를 수행할 수도 있습니다.

데이터 레이블 지정 작업의 가시성 증가

Amazon SageMaker 데이터 레이블 지정 제품 및 서비스를 통해 레이블 지정 작업과 품질 관리를 투명하게 진행할 수 있으므로, 품질 요구 사항이 충족되는지 확인할 수 있습니다. SageMaker Ground Truth Plus에서는 대화형 대시보드와 사용자 인터페이스를 제공합니다. 이를 통해 여러 프로젝트에서 훈련 데이터 집합의 진행 상황을 검토하고, 일일 처리량과 같은 프로젝트 지표를 추적하며, 레이블의 품질을 검사하고, 레이블이 지정된 데이터에 대한 피드백을 제공할 수 있습니다.

고품질 레이블 지정 데이터를 빠르게 수신

Amazon SageMaker 데이터 레이블 지정 제품 및 서비스를 사용하면 고품질 레이블 지정 데이터를 빠르게 수신할 수 있습니다. SageMaker Ground Truth Plus를 사용하면 보안, 개인 정보 보호 및 규정 준수 요구 사항에 따라 Amazon S3에서 데이터를 업로드하기만 하면 됩니다. 그러면 AWS 전문가가 데이터 레이블 지정 워크플로를 설정하고 전문 인력이 데이터 레이블 지정 태스크를 완료합니다.

Amazon SageMaker Ground Truth Plus 시작하기