Amazon SageMaker Ground Truth

기계 학습을 사용하여 매우 정확한 교육 데이터 세트를 구축하고 데이터 레이블링 비용을 최대 70% 절감하십시오.

Amazon SageMaker Ground Truth는 기계 학습을 위해 매우 정확한 교육 데이터 세트를 신속하게 구축할 수 있도록 지원합니다. SageMaker Ground Truth는 일반 및 사내 레이블링 작업자에게 간편한 액세스를 제공하며, 일반적인 레이블링 작업에 대한 워크플로와 인터페이스를 기본적으로 제공합니다. 또한, SageMaker Ground Truth는 자동 레이블링 기능을 사용하여 레이블링 비용을 최대 70%까지 낮출 수 있습니다. 이를 위해서는 Ground Truth가 독립적으로 데이터에 레이블을 지정하는 것을 배우도록 사람이 레이블을 지정한 데이터로 Ground Truth를 교육하면 됩니다.

성공적인 기계 학습 모델은 품질이 뛰어나고 방대한 교육 데이터를 기반으로 구축됩니다. 하지만 이러한 모델을 구축하는 데 필요한 교육 데이터를 만드는 프로세스는 시간 소모적이고 복잡하며 큰 비용을 들어가는 경우가 대부분입니다. 현재 생성되는 모델 대부분은 모델이 올바른 의사 결정을 내리는 방법을 배울 수 있도록 사람이 수동으로 데이터 레이블을 지정해야 합니다. 예를 들어 신호등, 정지 신호, 보행자와 같은 객체를 식별할 수 있을 정도로 신뢰할 수 있는 컴퓨터 비전 시스템을 구축하려면 수억 개의 비디오 프레임으로 구성된 수천 시간의 비디오 녹화 자료가 필요합니다. 이러한 각각의 프레임에서 도로, 다른 차량, 표지판과 같은 모든 중요 요소에 사람이 레이블을 지정한 후에야 개발하려는 모델에 대해 어떤 작업이든 시작할 수 있습니다.

Amazon SageMaker Ground Truth는 교육용 데이터 세트를 생성하는 데 필요한 시간과 노력을 크게 줄여주므로 비용이 절감됩니다. 기계 학습을 사용하여 데이터 레이블링을 자동화함으로써 이러한 절감 효과를 실현할 수 있습니다. 모델은 레이블링 작업자가 생성한 레이블을 통해 지속적으로 학습함으로써 시간이 지나면서 점진적으로 개선될 수 있습니다.

레이블링 모델이 지금까지 학습한 내용을 바탕으로 결과에 대한 신뢰도가 높은 경우, 자동으로 원시 데이터에 레이블을 적용합니다. 레이블링 모델은 결과에 대한 신뢰도가 낮은 경우, 사람에게 데이터를 전달하여 레이블을 지정하도록 합니다. 사람이 생성한 레이블은 이를 통해 학습하고 개선할 수 있도록 다시 레이블링 모델에 제공됩니다. 시간이 지나면서 SageMaker Ground Truth는 점점 더 많은 데이터를 자동으로 레이블링할 수 있고 교육 데이터 세트를 생성하는 속도도 크게 빨라집니다. 

이점

데이터 레이블링 비용을 최대 70% 절감

SageMaker Ground Truth는 기계 학습 모델을 사용하여 원시 데이터 레이블링을 자동화함으로써 수동 레이블링 비용의 극히 일부만으로 신속하게 고품질 교육 데이터 세트를 생산할 수 있습니다. 데이터는 활성 학습 모델이 높은 신뢰도로 레이블을 지정할 수 없는 경우에만 사람에게 라우팅됩니다. 그런 다음 사람이 레이블을 지정한 데이터로 모델을 교육하여 성능을 개선합니다. 그러면 다음 레이블링 작업에서는 사람에게 전달되는 데이터가 감소하므로 비용이 줄어듭니다. 

일반 및 사내 레이블링 작업자와 협력

레이블링 작업자 팀을 사용하고 레이블링 요청을 직접 해당 팀에 전달할 수 있습니다. 또는 규모를 확장해야 하는 경우, Amazon SageMaker Ground Truth 콘솔에서 조직 외부의 레이블링 작업자와 협력할 수 있는 옵션을 직접 제공합니다. Amazon Mechanical Turk와 통합하면 500,000명이 넘는 레이블링 작업자로 이루어진 일반 인력에 액세스할 수 있습니다. 또는 데이터에 기밀성이 요구되거나 특수 기술이 필요한 경우, Amazon에서 사전 선별한 전문 레이블링 회사를 사용할 수 있습니다.

정확한 결과를 신속하게 달성

Amazon SageMaker Ground Truth는 정확한 고품질 교육 데이터 세트를 신속하게 구축하는 데 도움이 됩니다. 기계가 생성한 레이블은 레이블별로 신뢰도 점수와 함께 일관된 결과를 제공하므로 서비스에서 레이블이 정확하다는 것을 얼마나 확신하는지 쉽게 이해할 수 있습니다. 사람이 레이블링한 결과는 사용자가 제공하는 기준에 따라 자동으로 채점되므로 역량이 뛰어난 레이블링 작업자에게 더 많은 데이터가 전달되고 역량이 부족한 레이블링 작업자는 정도를 낮추도록 합니다.

작동 방식

Product-Page-Diagram_SamurAI_How-it-works-2
Product-Page_Standard-Icons_01_Product-Features_SqInk
Amazon SageMaker Ground Truth 기능 살펴보기

설명서를 참조하여 Amazon SageMaker Ground Truth를 통해 가장 정확도가 높은 고품질 교육 데이터 세트를 구축하고 데이터 레이블링 비용을 최대 70%까지 절감할 수 있는 방법을 알아보십시오.

Product-Page_Standard-Icons_02_Sign-Up_SqInk
무료 계정에 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다. 

가입하기 
Product-Page_Standard-Icons_03_Start-Building_SqInk
콘솔에서 구축 시작

AWS Management Console에서 Amazon SageMaker Ground Truth로 구축을 시작하십시오.

로그인