我在尝试启动以下 Amazon SageMaker 资源之一时遇到了容量不足错误:
训练作业
批量转换作业
端点
笔记本实例
SageMaker Studio 应用程序
解决方法
当 AWS 没有足够的可用按需容量供特定区域或可用区内的 Amazon Elastic Compute Cloud (Amazon EC2) 实例类型完成您的请求时,就会出现此错误。请注意,容量不是静态的,会根据一天中的时间以及特定区域或可用区内的工作负载而变化。此错误不是由应用于您账户的资源限制造成的。由于容量问题是暂时性的,请务必在收到这些错误时重试请求。
如果您立即需要该实例,请执行以下操作:
- 切换到不同的实例类型。在同一个系列中切换到不同的实例大小,或者根据您的工作负载使用不同的实例系列。不同的实例类型可能具有更多的容量。
- 在不同的区域启动资源。请务必验证每个区域中可用的 SageMaker 实例类型。
如果您的请求可以延迟,请稍后再尝试检查所需的实例是否可用。
根据您正在尝试启动的 SageMaker 资源,您也可以尝试以下方法:
- 如果您要启动 SageMaker Studio 应用程序,最佳做法是通过覆盖更大可用区的子网启动 SageMaker Studio 域。使用跨越多个可用区的子网配置资源可以最大限度减少遇到容量问题的可能性。
- 如果您要启动笔记本实例或训练作业,请考虑以相同的实例类型启动实例,同时在不同的可用区指定不同的子网。
相关信息
实例容量不足
如何解决启动 EC2 实例时出现的 InsufficientInstanceCapacity 错误?