如何解决 SageMaker 中的“ResourceLimitExceeded”错误?

1 分钟阅读
0

我想解决 Amazon SageMaker 中的“ResourceLimitExceeded”错误。

解决方法

创建 SageMaker 资源时,您可能会收到 ResourceLimitExceeded 错误。这些资源包括 SageMaker 训练作业、处理作业、托管端点或 Studio 应用程序。当更改现有资源的实例配置时,您也可能会收到此错误。

错误示例:

"The account-level service limit 'ml.m5.xlarge for endpoint usage' is 0 Instances, with current utilization of 0 Instances and a request delta of 1 Instances.Please contact AWS support to request an increase for this limit."

当您超过为 SageMaker 资源指定的 AWS 账户级别服务配额时,将会出现此错误。请注意,所有配额均特定于您的账户、AWS 区域和使用类型。要解决此错误,请完成以下步骤:

  1. 打开服务配额控制台
    **注意:**要使用服务配额控制台,您的用户或角色必须具有相应的 AWS Identity and Access Management (IAM) 权限
  2. 在导航窗格中,选择 AWS services(AWS 服务)。
  3. 在搜索栏中,输入 Amazon SageMaker。然后,选择 Amazon SageMaker
  4. 选择要增加的配额。要查看示例错误消息,请选择 ml.m5.xlarge for endpoint usage(ml.m5.xlarge 端点使用量)。
  5. 选择 Request increase at account-level(请求在账户级别增加)。
  6. 对于 Increase quota value(增加配额值),输入所需的值。
  7. 选择 Request(请求)。

这会将您的请求发送给 AWS Support。根据您的使用案例和当前使用量,AWS Support 会批准、拒绝或部分批准您的请求。

相关信息

AWS 服务配额

SageMaker 服务配额

CreateTrainingJob

InstanceGroup

AWS 官方
AWS 官方已更新 4 个月前