게시된 날짜: Dec 1, 2021
오늘 고품질 훈련 데이터 집합을 빠르게 생성하고 비용을 최대 40%까지 절감할 수 있는 새로운 턴키 데이터 레이블 지정 서비스인 Amazon SageMaker Ground Truth Plus의 정식 출시를 발표하게 된 것을 기쁘게 생각합니다.
데이터 사이언티스트는 기계 학습 모델을 훈련하려면 레이블이 지정된 대용량의 고품질 데이터 집합이 필요합니다. 기계 학습의 채택이 증가하면 레이블 지정의 필요성도 높아집니다. 이로 인해 데이터 사이언티스트는 데이터 레이블 지정 워크플로를 구축하고 데이터 레이블 지정 인력을 관리하는 데 몇 주를 소비해야 합니다. 하지만 그 결과, 혁신 속도는 느려지고 비용은 증가합니다. 데이터 사이언티스트가 기계 학습 모델을 구축, 훈련 및 배포하는 데 시간을 할애할 수 있도록 하려면 그들은 일반적으로 데이터 운영 관리자와 프로그램 관리자로 구성된 다른 사내 팀에 고품질 훈련 데이터 집합 생성 작업을 맡깁니다. 그러나 이러한 팀은 일반적으로 기계 학습 결과에 영향을 미치는 고품질 교육 데이터 세트를 제공하는 데 필요한 기술에 액세스할 수 없습니다. 사내 리소스를 사용하지 않고 대규모로 고품질 교육 데이터 세트를 생성할 수 있는 턴키 서비스에 의존할 수 있다면 어떨까요? Amazon SageMaker Ground Truth Plus를 사용하십시오.
Amazon SageMaker Ground Truth Plus를 사용하면 데이터 운영 관리자 및 프로그램 관리자와 같은 비즈니스 관리자는 물론 데이터 사이언티스트가 데이터 레이블 지정 애플리케이션 구축 및 레이블 지정 인력 관리와 관련된 획일적인 육중한 작업을 제거하여 고품질 교육 데이터 집합을 쉽게 생성할 수 있습니다. 레이블 지정 요구 사항과 함께 데이터를 공유하기만 하면 Ground Truth Plus가 이러한 요구 사항을 기반으로 데이터 레이블 지정 워크플로를 설정 및 관리합니다. 거기에서 다양한 기계 학습 작업에 대해 교육을 받은 전문 인력이 데이터 레이블 지정 작업을 수행합니다. Ground Truth Plus를 사용하기 위해 깊은 기계 학습 전문 지식이나 워크플로 설계 및 품질 관리 지식이 필요하지 않습니다.
Ground Truth Plus는 활성 학습, 사전 레이블 지정 및 기계 검증을 포함한 기계 학습 기술을 사용합니다. 이는 출력 데이터 집합의 품질을 높이고 데이터 레이블 지정 비용은 낮춥니다. Ground Truth Plus는 데이터 레이블 지정 작업 및 품질 관리의 투명성을 제공합니다. 이를 통해 여러 프로젝트에서 교육 데이터 집합의 진행 상황을 검토하고, 일일 처리량과 같은 프로젝트 지표를 추적하고, 레이블의 품질을 검사하고, 레이블이 지정된 데이터에 대한 피드백을 제공할 수 있습니다. Ground Truth Plus는 컴퓨터 비전, 자연어 처리, 음성 인식 등과 같은 다양한 사용 사례에 활용할 수 있습니다.
Amazon SageMaker Ground Truth Plus는 현재 미국 동부(버지니아 북부)의 AWS 리전에서 사용할 수 있습니다. Amazon SageMaker Ground Truth Plus에 대한 자세한 내용은 블로그 게시물, Ground Truth Plus 설명서를 참조하고 SageMaker 데이터 레이블 지정 웹 페이지 또는 Ground Truth Plus 콘솔을 방문하여 시작하세요.