Amazon SageMaker 데이터 레이블링

기계 학습 모델의 훈련을 위한 고품질 데이터 세트 생성

훈련 데이터 세트 품질 개선

데이터 레이블링 인력 선택

데이터 레이블링 작업의 가시성 증가

고품질 레이블 지정 데이터를 빠르게 수신

Amazon SageMaker를 사용하면 이미지, 텍스트 파일 및 비디오와 같은 원시 데이터를 식별하고 정보 레이블을 추가하며 기계 학습(ML) 모델을 위한 고품질 훈련 데이터 세트를 생성하기 위해 레이블링된 가상 데이터를 생성할 수 있습니다. SageMaker는 Amazon SageMaker Ground Truth Plus 및 Amazon SageMaker Ground Truth와 같은 두 가지 옵션을 제공합니다. 이 기능을 통해 직접 데이터 레이블링 워크플로를 관리하거나 사용자를 대신하여 데이터 레이블링을 생성 및 관리하기 위해 전문 입력을 유연하게 활용할 수 있습니다.

Amazon SageMaker Ground Truth Plus

SageMaker Ground Truth Plus를 사용하면 레이블링 애플리케이션을 구축하거나 레이블링 인력을 직접 관리할 필요 없이 고품질 훈련 데이터 세트를 생성할 수 있습니다. SageMaker Ground Truth Plus를 사용하여 데이터 레이블링 비용을 40%까지 절감할 수 있습니다. SageMaker Ground Truth Plus에서는 기계 학습 태스크에 대해 훈련된 전문가 인력을 제공하며, 이를 통해 데이터 보안, 개인 정보 보호 및 규정 준수 요구 사항을 충족할 수 있습니다. 데이터를 업로드하면, SageMaker Ground Truth Plus에서 사용자를 대신하여, 데이터 레이블링 워크플로 및 인력을 생성하고 관리합니다.

Amazon SageMaker Ground Truth

고유한 데이터 레이블링 워크플로 및 인력을 유연하게 구축하고 관리하려면 SageMaker Ground Truth를 사용할 수 있습니다. SageMaker Ground Truth는 쉽게 데이터에 레이블을 지정하고 Amazon Mechanical Turk, 서드 파티 공급 업체 또는 자체 프라이빗 인력을 통해 사내 주석 담당자를 사용하는 옵션을 제공하는 데이터 레이블링 서비스입니다.

또한, 실제 데이터를 수동으로 수집하거나 레이블링하지 않고도 레이블링된 가상 데이터를 생성할 수 있습니다. SageMaker Ground Truth는 사용자를 대신하여 자동 레이블링되는 수십만 개의 가상 이미지를 생성할 수 있습니다.

작동 방식

  • SageMaker Ground Truth Plus를 사용하여 데이터 레이블 지정
  • SageMaker Ground Truth를 사용하여 데이터 레이블 지정
  • 레이블링된 가상 데이터 생성
  • 기능 비교
  • SageMaker Ground Truth Plus를 사용하여 데이터 레이블 지정
  • Amazon SageMaker Ground Truth Plus를 사용하면 레이블 지정 애플리케이션을 구축하거나 레이블 지정 인력을 관리할 필요 없이 고품질 훈련 데이터 집합을 생성할 수 있습니다.

    Amazon SageMaker Ground Truth Plus 작동 방식
  • SageMaker Ground Truth를 사용하여 데이터 레이블 지정
  • Amazon SageMaker Ground Truth는 자체 데이터 레이블 지정 워크플로 및 데이터 레이블 지정 인력을 구축하고 관리하는 데 도움이 됩니다.

    Amazon SageMaker Ground Truth의 작동 방식
  • 레이블링된 가상 데이터 생성
  • Amazon SageMaker Ground Truth를 통해 레이블링된 가상 데이터를 생성할 수 있습니다.

    레이블링된 가상 데이터 생성
  • 기능 비교
  • 범주 Amazon SageMaker Ground Truth Amazon SageMaker Ground Truth Plus
    데이터 레이블링 워크플로 텍스트, 이미지, 동영상 및 3D 포인트 클라우드에 대한 사용자 지정 또는 30개가 넘는 기본 제공 워크플로를 지원합니다. 데이터 레이블링 워크플로 및 데이터 레이블링 품질 관리 텍스트, 이미지, 동영상 및 3D 포인트 클라우드에 대한 사용자 지정 또는 30개가 넘는 기본 제공 워크플로를 지원합니다. 데이터 레이블링 워크플로 및 데이터 레이블링 품질 관리
    사용자 데이터 사이언티스트 및 기계 학습 엔지니어 데이터 사이언티스트, 기계 학습 엔지니어, 데이터 작업 관리자, 프로그램 관리자
    인력 옵션: 서드 파티 공급 업체, Amazon Mechanical Turk 또는 자체 프라이빗 인력 데이터 보안, 개인 정보 보호 및 규정 준수 요구 사항을 충족하는 데 도움이 되는 전문 인력 
    기계 학습 레이블링 기술  적극적 학습 적극적 학습, 사전 레이블링 및 기계 검증 
    가상 데이터 생성 지원됨 지원됨

이점

훈련 데이터 세트 품질 개선

Amazon SageMaker 데이터 레이블링 오퍼링에서는 가상 데이터 생성을 포함하여 수동 오류를 줄여줄 수 있는 기계 학습(ML) 레이블링 기술을 제공하며, 훈련 데이터 세트의 품질을 개선하는 데 도움을 줍니다. Amazon SageMaker Ground Truth Plus에서는 사전 레이블링, 오류 및 낮은 품질의 레이블을 탐지하기 위해 사람이 지정한 레이블의 기계 검증, 보조 레이블링 기능(예: 3D 입방체 스내핑, 비디오 레이블링의 다음 프레임 예측, 자동 세그먼트 도구)을 포함하는 다단계 레이블링 워크플로를 지원합니다. 자체적인 데이터 레이블 지정 워크플로를 관리하고 있는 경우 SageMaker Ground Truth에서는 자동화된 레이블 지정 기능(예: 자동 세그먼트, 자동 3D 입방체 스냅핑, 2D 비디오 프레임에서 센서 융합)을 제공합니다. 또한, SageMaker Ground Truth에서는 적극적 학습을 사용하고 모델에서 자신 있게 레이블을 지정할 수 없는 경우에만 사용자에게 레이블이 지정된 데이터를 연결하는 자동 데이터 레이블 지정 기능을 제공합니다.

데이터 레이블링 인력 선택

Amazon SageMaker 데이터 레이블링 오퍼링에서는 데이터를 레이블링하는 두 가지 옵션을 제공합니다. 먼저, SageMaker Ground Truth Plus를 사용하면 기계 학습 태스크에서 훈련을 받은 전문 인력이 사용자의 품질 및 소요 시간 요구 사항에 따라 데이터에 레이블을 지정합니다. 그런 다음, SageMaker Ground Truth에서 데이터 레이블링 워크플로를 구축하고 관리할 수 있습니다. 조직 내부와 외부의 레이블러와 함께 협력하는 옵션이 있습니다. 예를 들어, 레이블링 작업을 자체 레이블러에게 전송할 수도 있고, 이미 Amazon Mechanical Turk를 통해 기계 학습 관련 작업을 수행하고 있는 500,000명이 넘는 독립 계약업체 인력도 이용할 수 있습니다. 데이터에 기밀성 또는 특수한 기술이 요구되는 경우에는 AWS에서 사전 선별한 공급 업체를 이용하여 품질 및 보안 절차를 수행할 수도 있습니다. 훈련 데이터 세트를 통해 기계 학습(ML) 모델 훈련의 완성도를 높이도록 가상 데이터에 액세스해야 하는 경우 AWS 디지털 아티스트는 고객이 제공하는 자산 및 이미지를 사용하여 사용자를 대신해 자동 레이블링된 가상 데이터를 생성합니다.

데이터 레이블링 작업의 가시성 증가

Amazon SageMaker 데이터 레이블 지정 제품 및 서비스를 통해 레이블 지정 작업과 품질 관리를 투명하게 진행할 수 있으므로, 품질 요구 사항이 충족되는지 확인할 수 있습니다. SageMaker Ground Truth Plus에서는 대화형 대시보드와 사용자 인터페이스를 제공합니다. 이를 통해 여러 프로젝트에서 훈련 데이터 집합의 진행 상황을 검토하고, 일일 처리량과 같은 프로젝트 지표를 추적하며, 레이블의 품질을 검사하고, 레이블이 지정된 데이터에 대한 피드백을 제공할 수 있습니다.

고품질 레이블 지정 데이터를 빠르게 수신

Amazon SageMaker 데이터 레이블링 제품 및 서비스를 사용하면 고품질 레이블링 데이터를 빠르게 수신할 수 있습니다. SageMaker Ground Truth Plus를 사용하여 보안, 개인 정보 보호 및 규정 준수 요구 사항에 따라 Amazon S3에서 데이터를 업로드합니다. 그러면 AWS 전문가가 데이터 레이블링 워크플로를 설정하고 전문 인력이 데이터 레이블링 태스크를 완료합니다. 가상 데이터에 액세스해야 하는 경우 이미지 요구 사항을 지정하거나 3D 자산 및 기준 이미지를 제공합니다. 그러면 SageMaker Ground Truth에서 기계 학습(ML) 모델 훈련을 위해 보다 정확한 레이블링된 가상 데이터를 생성할 수 있습니다.

Amazon SageMaker Ground Truth 요금
질문이 있으신가요?

Amazon SageMaker 데이터 레이블 지정 FAQ 페이지를 방문하세요.

자세히 알아보기 
AWS 계정에 가입
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

가입 
콘솔에서 구축 시작
콘솔에서 구축 시작

AWS 관리 콘솔에서 Amazon SageMaker 데이터 레이블 지정을 사용하여 구축을 시작해보세요.

로그인