如何解决 Amazon SageMaker 中出现的“ResourceLimitExceeded”这一错误?
上次更新时间:2020 年 8 月 25 日
我正在尝试启动一个 Amazon SageMaker 资源,但我收到“ResourceLimitExceeded”这一错误。如何确定我已达到的服务配额?
简短描述
对于每项 AWS 服务,每个 AWS 账户都有默认配额(以前称为限额)。有关 Amazon SageMaker 配额的列表,请参阅服务配额。每个配额都针对的是特定的 AWS 区域,另有说明的除外。对于一些配额(并非全部都可以),您可以请求增加。
解决方法
检查 ResourceLimitExceeded这一错误以查找触发配额异常的API 操作。然后,在下表中找到该 API 操作并查看关联的配额。查看操作的所有配额,这一点非常重要。有时,增加一个资源的配额可能会导致您超出另一个资源的配额。
注意: 下表中的 API 操作包括此操作的所有函数(例如,CreateNotebookInstance、UpdateNotebookInstance、StartNotebookInstance 等等)。
API 操作 | 相应的服务配额 |
---|---|
笔记本实例 | Amazon SageMaker 笔记本 |
HyperParameterTuningJob | Amazon SageMaker 自动模型优化 |
ProcessingJob | Amazon SageMaker 处理 |
TrainingJob | Amazon SageMaker 培训和托管现场培训 |
终端节点 | Amazon SageMaker 托管 |
TransformJob | Amazon SageMaker 批量转换 |
LabelingJob | Amazon SageMaker Ground Truth |
注意:需分别对按需实例配额和 Spot 实例配额进行跟踪和修改。有关更多信息,请参阅服务配额。
在您确定需要增加配额的资源之后,请再确定要请求增加的数量。此信息包含在错误消息中。例如,假定您要在us-east-1区域中使用18 个 ml.m5.2xlarge笔记本实例来创建一个终端节点。您会收到这一错误:
ResourceLimitExceeded: An error occurred (ResourceLimitExceeded) when calling the CreateEndpoint operation:
The account-level service limit 'ml.m5.2xlarge for endpoint usage' is 20 Instances, with current utilization of 4 Instances
and a request delta of 18 Instances.
Please contact AWS support to request an increase for this limit
以下是如何来理解这一错误消息:
- “账户级服务限额”:资源的配额
- “当前利用率”:您已在使用的资源(在此示例中为ml.m5.2xlarge 实例)数量
- “请求增量”:您请求的资源数量
在此示例中,配额中只剩下 16 个 ml.m5.2xlarge实例,但您请求的是 18 个。您还需要另外两个ml.m5.2xlarge实例。请求在us-east-1获得 22 个ml.m5.2xlarge Amazon SageMaker 托管实例这一新配额:
- 打开AWS Support 中心,然后选择创建案例。
- 选择提升服务限额。
- 填写并提交表格。
有关更多信息,请参阅AWS 服务配额。