Amazon SageMaker에서 ResourceLimitExceeded 오류를 해결하려면 어떻게 해야 합니까?
최종 업데이트 날짜: 2020년 8월 25일
Amazon SageMaker 리소스를 시작하려고 하는데 ResourceLimitExceeded 오류가 발생합니다. 도달한 서비스 할당량을 확인하려면 어떻게 해야 합니까?
간략한 설명
각 AWS 계정에는 각 AWS 서비스에 대한 기본 할당량(이전에는 한도라고 함)이 있습니다. Amazon SageMaker 할당량 목록은 서비스 할당량을 참조하세요. 다른 언급이 없는 한, 각 할당량은 리전별로 다릅니다. 일부 할당량(전부는 아님)에 대한 증가를 요청할 수 있습니다.
해결 방법
할당량 예외를 트리거한 API 작업을 찾기 위해 ResourceLimitExceeded 오류를 확인합니다. 그리고 나서 다음 표에서 해당 API 작업을 찾아 관련 할당량을 검토합니다. 작업에 대한 모든 할당량을 검토하는 것이 중요합니다. 때로는 한 리소스에 대한 할당량을 늘릴 때 다른 리소스에 대한 할당량을 초과할 수 있습니다.
참고: 다음 표의 API 작업에는 작업에 대한 모든 함수(예: CreateNotebookInstance, UpdateNotebookInstance, StartNotebookInstance 등)가 포함되어 있습니다.
API 작업 | 해당 서비스 할당량 |
---|---|
NotebookInstance | Amazon SageMaker 노트북 |
HyperParameterTuningJob | Amazon SageMaker 자동 모델 튜닝 |
ProcessingJob | Amazon SageMaker 처리 |
TrainingJob | Amazon SageMaker 교육 및 관리형 스팟 교육 |
Endpoint | Amazon SageMaker 호스팅 |
TransformJob | Amazon SageMaker 배치 변환 |
LabelingJob | Amazon SageMaker Ground Truth |
참고: 온디맨드 할당량과 스팟 인스턴스 할당량은 따로 추적되고 수정됩니다. 자세한 내용은 서비스 할당량을 참조하세요.
증가가 필요한 리소스를 결정한 후에는 요청할 증가량을 결정합니다. 이 정보는 오류 메시지에 있습니다. 예를 들어 us-east-1 리전에서 ml.m5.2xlarge 노트북 인스턴스 18개가 있는 엔드포인트를 만든다고 가정합니다. 이 오류가 발생합니다.
ResourceLimitExceeded: An error occurred (ResourceLimitExceeded) when calling the CreateEndpoint operation:
The account-level service limit 'ml.m5.2xlarge for endpoint usage' is 20 Instances, with current utilization of 4 Instances
and a request delta of 18 Instances.
Please contact AWS support to request an increase for this limit
오류 메시지를 해석하는 방법은 다음과 같습니다.
- "Account-level service limit": 리소스에 대한 할당량
- "Current utilization": 이미 사용 중인 리소스(이 경우에는 ml.m5.2xlarge 인스턴스) 수
- "Request delta": 요청한 리소스 수
이 예에서는 할당량에 ml.m5.2xlarge 인스턴스 16개만 남아 있지만 18개를 요청했습니다. ml.m5.2xlarge 인스턴스가 두 개 더 필요합니다. us-east-1에서 ml.m5.2xlarge Amazon SageMaker 호스팅 인스턴스가 22개인 새로운 할당량을 요청합니다.
- AWS 지원 센터를 열고 [사례 생성]을 선택합니다.
- [서비스 한도 증가]를 선택합니다.
- 양식을 작성하고 제출합니다.
자세한 내용은 AWS 서비스 할당량을 참조하세요.