如何解决启动 Amazon SageMaker 资源时出现的容量不足错误?

上次更新日期:2022 年 11 月 16 日

我在尝试启动以下 Amazon SageMaker 资源之一时遇到了容量不足错误:

  • 训练作业
  • 批量转换作业
  • 端点
  • 笔记本实例
  • SageMaker Studio 应用程序

解决方法

当 AWS 没有足够的可用按需容量供特定区域或可用区内的 Amazon Elastic Compute Cloud (Amazon EC2) 实例类型完成您的请求时,就会出现此错误。请注意,容量不是静态的,会根据一天中的时间以及特定区域或可用区内的工作负载而变化。此错误不是由应用于您账户的资源限制造成的。由于容量问题是暂时性的,请务必在收到这些错误时重试请求。

如果您立即需要该实例,请执行以下操作:

  • 切换到不同的实例类型。在同一个系列中切换到不同的实例大小,或者根据您的工作负载使用不同的实例系列。不同的实例类型可能具有更多的容量。
  • 在不同的区域启动资源。请务必验证每个区域中可用的 SageMaker 实例类型

如果您的请求可以延迟,请稍后再尝试检查所需的实例是否可用。

根据您正在尝试启动的 SageMaker 资源,您也可以尝试以下方法:

  • 如果您要启动 SageMaker Studio 应用程序,最佳做法是通过覆盖更大可用区的子网启动 SageMaker Studio 域。使用跨越多个可用区的子网配置资源可以最大限度减少遇到容量问题的可能性。
  • 如果您要启动笔记本实例或训练作业,请考虑以相同的实例类型启动实例,同时在不同的可用区指定不同的子网。

这篇文章对您有帮助吗?


您是否需要账单或技术支持?