如何排查 Amazon SageMaker 中的“ResourceLimitExceeded”错误?

1 分钟阅读
0

我想要排查 Amazon SageMaker 中的“ResourceLimitExceeded”错误。

解决方法

创建 SageMaker 资源(例如处理作业、训练作业、端点或 Studio 应用程序)时,您可能会收到 ResourceLimitExceeded 错误。请参阅以下示例错误消息:

“账户级服务限制‘ml.m5.xlarge 端点使用量’为 0 个实例,当前利用率为 0 个实例,请求增量为 1 个实例。请联系 AWS Support 请求提高此限制。”

超出为 SageMaker 资源指定的账户级服务限额时,通常会发生此错误。

要解决此错误,请执行以下操作:

1.    打开服务限额控制台
**注意:**要使用服务限额控制台,您需要在用户或角色中拥有相应的 AWS Identity and Access Management(IAM)权限

2.    从导航栏的 AWS 区域选择器中,选择出现错误的区域。

3.    在导航窗格中,选择 AWS 服务

4.    在搜索栏中,输入 Amazon SageMaker

5.    选择 Amazon SageMaker

6.    选择要增加的限额。对于前面的错误消息示例,请选择 ml.m5.xlarge 端点使用量

7.    选择请求增加限额

8.    对于更改限额值,请输入所需的值。

9.    选择请求

此操作会将您的请求发送给 AWS Support。根据您的使用案例和当前使用量,您的请求会被批准、拒绝或部分批准。


相关信息

AWS 服务限额

SageMaker 服务限额

AWS 官方
AWS 官方已更新 1 年前