AWS Batch, 이제 SageMaker 훈련 작업 일정 관리 지원

게시된 날짜: 2025년 7월 31일

오늘부터 AWS Batch가 SageMaker 훈련 작업의 일정 관리를 지원합니다. SageMaker 훈련 작업에 AWS Batch를 사용하는 데이터 과학자는 AWS Batch로 구동되는 구성 가능한 대기열에 훈련 작업을 제출할 수 있습니다. 이번 통합으로 이제 우선순위와 리소스 가용성을 기반으로 작업 일정을 관리할 수 있으며, 수동으로 재시도하거나 조율할 필요가 없습니다. 또한 시스템 관리자는 공정 점유 정책을 설정하여 팀 전체의 리소스 사용률을 최적화할 수 있습니다. 시스템은 실패한 작업을 자동으로 재시도하고 대기열 상태에 대한 가시성을 제공합니다.

더불어 SageMaker Flexible Training Plan(FTP)을 구매하여 필요한 시간 동안 필요한 용량을 확보할 수 있습니다. Flexible Training Plan을 활용하면 Batch의 대기열 기능을 통해 훈련을 계획한 기간 동안 사용률을 극대화할 수 있습니다. 데이터 과학자는 인프라 복잡성이 자동으로 처리된다는 점에 안심하고 SageMaker Python SDK를 통해 직접 실험을 제출할 수 있습니다.

AWS Batch는 AWS Management Console, AWS Command Line Interface(AWS CLI) 또는 AWS SDK를 통해 SageMaker 훈련 작업에 즉시 사용할 수 있습니다. AWS Batch 자체에는 추가 요금이 부과되지 않습니다. 애플리케이션 실행에 사용한 AWS 리소스에 대해서만 비용을 지불하면 됩니다. SageMaker 훈련 작업용 AWS Batch는 현재 AWS Batch 및 SageMaker AI가 제공되는 모든 상용 AWS 리전에서 정식 버전으로 이용할 수 있습니다. 시작하려면 SageMaker 훈련 작업용 AWS Batch 설명서블로그 게시물을 참조하세요.