게시된 날짜: Dec 3, 2019
Amazon SageMaker Processing은 완전관리형 환경에서 전처리 또는 후처리 및 모델 평가 워크로드를 실행할 수 있는 Amazon SageMaker의 새로운 기능입니다.
데이터 전/후 처리 및 모델 평가 단계는 일반적인 ML(기계 학습) 워크플로에서 중요한 부분입니다. 일반적으로 이러한 작업은 별도의 인프라에서 실행됩니다. 이 인프라를 여러 사용자에 걸쳐 관리 및 확장하려면 어렵고 비용이 많이 듭니다. 이 목표를 실현하기 위해 다양한 도구를 사용하려면 상당한 작업 부담을 수반하므로 개발자와 데이터 과학자는 성능과 확장성을 위해 인프라를 튜닝하는 데 상당한 시간을 소모합니다.
Amazon SageMaker Processing을 통해 고객은 Amazon SageMaker에서 데이터 엔지니어링 및 모델 평가를 위한 분석 작업을 규모에 맞추어 손쉽게 실행할 수 있습니다. SageMaker Processing은 교육 및 호스팅과 같은 다른 중요한 ML 작업과 결합되므로, 고객이 Amazon SageMaker에 내장된 모든 보안 및 규정 준수 보증을 통해 완전관리형 환경의 이점을 누릴 수 있습니다. Amazon SageMaker Processing을 통해 고객은 내장된 데이터 처리 컨테이너를 사용하거나 자체 컨테이너를 가져오고 관리형 인프라에서 실행할 사용자 지정 작업을 제출할 수 있습니다. 제출된 Amazon SageMaker는 컴퓨팅 인스턴스를 시작하고 입력 데이터를 처리 및 분석하며 작업을 완료하면 리소스를 릴리스합니다.