Amazon SageMaker AI のトレーニングジョブ、バッチ変換ジョブ、エンドポイント、ノートブックインスタンス、または SageMaker Studio アプリを起動する際、「InsufficientCapacity」エラーが発生します。
解決策
AWS でリクエストを完了するのに十分なオンデマンド容量が不足している場合は、次のエラーメッセージに類似した InsufficientCapacity エラーが発生することがあります。
「Unable to provision requested ML compute capacity due to InsufficientInstanceCapacity error.Please retry using a different ML instance type or after some time」 (インスタンス容量が不足しているため、要求された ML コンピューティング容量をプロビジョニングできません。別の ML インスタンスタイプを使用するか、しばらくしてから再試行してください)
「An error occurred (InsufficientInstanceCapacity) when calling the StartInstances operation (reached max retries: 4): Insufficient capacity」
Amazon Elastic Compute Cloud (Amazon EC2) インスタンスのキャパシティは静的ではありません。インスタンスのキャパシティは、特定の AWS リージョンまたはアベイラビリティーゾーンのワークロードに左右されます。キャパシティ不足エラーは、AWS が AWS アカウントに適用するリソースクォータとは関連していません。
キャパシティの問題は一時的なもので、リクエストを再試行すると解決する場合があります。リクエストを遅延させても問題ない場合は、後でリクエストを試してください。
インスタンスにすぐにアクセスするには、次のいずれかの手順を実行します。
- ワークロードに応じて、同じファミリーの大きいインスタンスサイズに切り替えるか、別のインスタンスタイプに切り替えるか、別のインスタンスファミリーを使用します。
- キャパシティはインスタンスタイプによって異なるため、同じインスタンスタイプの別のリージョンまたはアベイラビリティーゾーンでリソースを起動します。各リージョンで使用可能な SageMaker インスタンスタイプを確認してください。
注: インスタンスタイプの可用性を確認するには、[オンデマンド料金] ページで該当する SageMaker 機能のタブを選択し、[リージョン] のドロップダウンリストから該当するリージョンを選択します。
- インスタンス数を減らして新しいインスタンスリクエストを送信してください。
- アベイラビリティーゾーンは指定せずに、新しいリクエストを送信してください。
- ミッションクリティカルなワークロード用にインスタンスを予約するには、オンデマンドのキャパシティ予約を使用します。キャパシティ予約を作成する方法については、「キャパシティ予約を作成する」を参照してください。
SageMaker Studio アプリを起動する場合、キャパシティの問題を最小限に抑えるために、複数のアベイラビリティーゾーンにわたるサブネットを使用してアプリを構成することをおすすめします。
ノートブックインスタンスまたはトレーニングジョブを起動する場合は、別々のアベイラビリティーゾーンで複数のサブネットを持つ同じインスタンスタイプを選択します。
関連情報
インスタンスのキャパシティ不足
サポートされるリージョンとクォータ