如何解决 Amazon SageMaker 中出现的“ResourceLimitExceeded”这一错误?

上次更新时间:2020 年 8 月 25 日

我正在尝试启动一个 Amazon SageMaker 资源,但我收到“ResourceLimitExceeded”这一错误。如何确定我已达到的服务配额?

简短描述

对于每项 AWS 服务,每个 AWS 账户都有默认配额(以前称为限额)。有关 Amazon SageMaker 配额的列表,请参阅服务配额。每个配额都针对的是特定的 AWS 区域,另有说明的除外。对于一些配额(并非全部都可以),您可以请求增加。

解决方法

检查 ResourceLimitExceeded这一错误以查找触发配额异常的API 操作。然后,在下表中找到该 API 操作并查看关联的配额。查看操作的所有配额,这一点非常重要。有时,增加一个资源的配额可能会导致您超出另一个资源的配额。

注意: 下表中的 API 操作包括此操作的所有函数(例如,CreateNotebookInstance、UpdateNotebookInstance、StartNotebookInstance 等等)。

API 操作 相应的服务配额
笔记本实例 Amazon SageMaker 笔记本
HyperParameterTuningJob Amazon SageMaker 自动模型优化
ProcessingJob Amazon SageMaker 处理
TrainingJob Amazon SageMaker 培训和托管现场培训
终端节点 Amazon SageMaker 托管
TransformJob Amazon SageMaker 批量转换
LabelingJob Amazon SageMaker Ground Truth

注意:需分别对按需实例配额和 Spot 实例配额进行跟踪和修改。有关更多信息,请参阅服务配额

在您确定需要增加配额的资源之后,请再确定要请求增加的数量。此信息包含在错误消息中。例如,假定您要在us-east-1区域中使用18 个 ml.m5.2xlarge笔记本实例来创建一个终端节点。您会收到这一错误:

ResourceLimitExceeded: An error occurred (ResourceLimitExceeded) when calling the CreateEndpoint operation: 
The account-level service limit 'ml.m5.2xlarge for endpoint usage' is 20 Instances, with current utilization of 4 Instances 
and a request delta of 18 Instances. 
Please contact AWS support to request an increase for this limit

以下是如何来理解这一错误消息:

  • “账户级服务限额”:资源的配额
  • “当前利用率”:您已在使用的资源(在此示例中为ml.m5.2xlarge 实例)数量
  • “请求增量”:您请求的资源数量

在此示例中,配额中只剩下 16 个 ml.m5.2xlarge实例,但您请求的是 18 个。您还需要另外两个ml.m5.2xlarge实例。请求在us-east-1获得 22 个ml.m5.2xlarge Amazon SageMaker 托管实例这一新配额:

  1. 打开AWS Support 中心,然后选择创建案例
  2. 选择提升服务限额
  3. 填写并提交表格。

有关更多信息,请参阅AWS 服务配额


这篇文章对您有帮助吗?


您是否需要账单或技术支持?