게시된 날짜: Oct 21, 2022
오늘 AWS는 Amazon SageMaker Data Wrangler에서 Data Wrangler 처리 작업 예약 기능을 지원한다고 발표했습니다. Amazon SageMaker Data Wrangler는 기계 학습(ML)을 위해 데이터를 집계하고 준비하는 시간을 몇 주에서 몇 분으로 단축합니다. SageMaker Data Wrangler를 통해 데이터 준비 및 특성 추출 프로세스를 간소화하고 단일 시각적 인터페이스에서 데이터 선택, 정리, 탐색 및 시각화를 포함한 데이터 준비 워크플로의 모든 단계를 완료할 수 있습니다. 이전에는 데이터 처리 작업 예약에 서버리스 컴퓨팅 기능 및 이벤트 버스 서비스와의 통합이 포함되어 있었습니다. 또한 이 프로세스에는 프로덕션 환경에서 데이터 처리 작업을 예약하기 위해 코드를 작성하는 과정이 포함되어 있었습니다. 이러한 다양한 기능이 함께 통합되어 있고 이 워크플로를 오케스트레이션하기 위해 코드를 작성해야 하기 때문에 데이터 과학자, 데이터 엔지니어 및 ML 엔지니어에게 노력과 시간이 많이 드는 작업이 될 수 있습니다.
Data Wrangler에서 예약이 가능해짐에 따라 이제 클릭 몇 번으로 Data Wrangler 처리 작업을 예약할 수 있게 되었습니다. 작업이 특정 시점 및 특정 일자에 실행되도록 예약할 수 있습니다. 또한 일정은 추가 사용자 지정 및 유연성을 위해 CRON 표현식으로 입력될 수 있습니다(해당 월의 첫 번째 수요일에 실행할 작업을 예약하는 인스턴스). Data Wrangler 처리 작업에 최대 두 개의 일정을 연결할 수 있습니다. 원하는 일정을 입력하면 Data Wrangler가 추가 확인을 실행할 5개의 다음 예정 작업의 미리 보기를 표시합니다. 이 예약 기능에 Data Wrangler에서 “Create Job” 워크플로의 일부로 액세스할 수 있습니다.