Amazon SageMaker Ground Truth

기계 학습용 훈련 데이터를 대규모로 간편하게 레이블링

Amazon SageMaker Ground Truth는 기계 학습을 위한 고도로 정확한 훈련 데이터 세트를 손쉽게 구축할 수 있게 해 주는 완전관리형 데이터 레이블링 서비스입니다. SageMaker Ground Truth 콘솔을 통해 사용자 지정 또는 기본 제공 데이터 레이블링 워크플로를 활용하여 데이터 레이블링을 몇 분 만에 시작하십시오. 이러한 워크플로는 3D 포인트 클라우드, 컴퓨터 비전, 자연어 처리를 포함하여 다양한 사용 사례를 지원합니다. 레이블러는 워크플로의 일부로 자동 3D 입방체 스내핑(Cuboid Snapping), 2D 이미지 왜곡 제거, 자동 세그먼트 도구 같은 보조 레이블링 기능을 활용하여 데이터 세트 레이블링에 소요되는 시간을 줄일 수 있습니다. 또한 Ground Truth에서 제공되는 자동 데이터 레이블링 기능은 기계 학습 모델을 사용하여 데이터를 레이블링합니다.

이점

데이터 레이블 정확도 개선

SageMaker Ground Truth는 주석 통합 및 감사 워크플로를 통해 레이블의 품질을 개선하도록 지원합니다. 주석 통합은 둘 이상의 데이터 레이블러로부터 레이블 입력을 수집하고 이를 결합하여 기계 학습 모델을 위한 단일 데이터 레이블을 생성하는 프로세스입니다. 작업자는 기본 제공 감사 및 검토 워크플로를 통해 레이블을 검증하고 필요에 따라 조정하여 정확도를 높일 수 있습니다.

사용 편의성

SageMaker Ground Truth는 ‘자동 세그먼트’, ‘자동 3D 입방체 스내핑’, ‘2D 동영상 프레임을 통한 센서 퓨전(Sensor Fusion)’ 같은 자동화된 레이블링 기능을 직관적인 사용자 인터페이스를 통해 제공하여 품질을 개선하는 동시에 데이터 레이블링 태스크에 소요되는 시간을 줄일 수 있게 해 줍니다. 의미 체계 세분화의 경우, 작업자는 이미지의 객체를 레이블링해야 합니다. 작업자는 자동 세그먼트 기능을 사용하여 수백 번이 아닌 4번의 클릭으로 객체를 캡처할 수 있습니다.

최대 70% 비용 절감

SageMaker Ground Truth는 데이터 레이블링을 자동으로 수행합니다. 활성 학습 모델을 사용하여 데이터가 레이블링되고, 모델이 높은 신뢰도로 레이블링할 수 없는 경우에만 데이터가 사람에게 라우팅됩니다. 그런 후 사람이 레이블링한 데이터로 기계 학습 모델을 훈련시켜 정확도를 개선합니다. 그 결과, 다음번 레이블에서는 사람에게 전송되는 데이터가 줄어들어 데이터 레이블링 비용이 70%까지 절감됩니다.

인력 선택

SageMaker Ground Truth에서는 조직 안팎의 레이블러와 함께 협력할 수 있는 옵션을 제공합니다. SageMaker Ground Truth를 사용하면 레이블링 작업을 자체 레이블러에게 손쉽게 전송할 수도 있고, 이미 Amazon Mechanical Turk를 통해 기계 학습 관련 작업을 수행하고 있는 500,000명이 넘는 독립 계약업체 인력도 이용할 수 있습니다. 데이터에 기밀성 또는 특수한 기술이 요구되는 경우에는 iVision, CapeStart Inc., Cogito, iMerit 등 AWS에서 사전 선별한 공급업체를 이용하여 품질 및 보안 절차를 수행할 수 있습니다.

작동 방식

Amazon SageMaker Ground Truth의 작동 방식
Amazon SageMaker Ground Truth 자습서
자습서 시작하기

Amazon SageMaker Ground Truth를 사용하여 이미지 분류에 대한 매우 정확한 교육 데이터 세트를 구축하는 방법에 대해 알아봅니다.

무료 AWS 계정에 가입
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

콘솔에서 구축 시작
콘솔에서 구축 시작

AWS Management Console에서 Amazon SageMaker Ground Truth로 구축을 시작하십시오.