我想解决 Amazon SageMaker 中的“ResourceLimitExceeded”错误。
解决方法
创建 SageMaker 资源时,您可能会收到 ResourceLimitExceeded 错误。这些资源包括 SageMaker 训练作业、处理作业、托管端点或 Studio 应用程序。当更改现有资源的实例配置时,您也可能会收到此错误。
错误示例:
"The account-level service limit 'ml.m5.xlarge for endpoint usage' is 0 Instances, with current utilization of 0 Instances and a request delta of 1 Instances.Please contact AWS support to request an increase for this limit."
当您超过为 SageMaker 资源指定的 AWS 账户级别服务配额时,将会出现此错误。请注意,所有配额均特定于您的账户、AWS 区域和使用类型。要解决此错误,请完成以下步骤:
- 打开服务配额控制台。
**注意:**要使用服务配额控制台,您的用户或角色必须具有相应的 AWS Identity and Access Management (IAM) 权限。
- 在导航窗格中,选择 AWS services(AWS 服务)。
- 在搜索栏中,输入 Amazon SageMaker。然后,选择 Amazon SageMaker。
- 选择要增加的配额。要查看示例错误消息,请选择 ml.m5.xlarge for endpoint usage(ml.m5.xlarge 端点使用量)。
- 选择 Request increase at account-level(请求在账户级别增加)。
- 对于 Increase quota value(增加配额值),输入所需的值。
- 选择 Request(请求)。
这会将您的请求发送给 AWS Support。根据您的使用案例和当前使用量,AWS Support 会批准、拒绝或部分批准您的请求。
相关信息
AWS 服务配额
SageMaker 服务配额
CreateTrainingJob
InstanceGroup