Amazon Elastic Compute Cloud (Amazon EC2) オンデマンドインスタンスのサービスクォータの引き上げをリクエストして、既存の vCPU クォータと利用可能な vCPU クォータについて把握したいと考えています。
簡単な説明
Amazon EC2 vCPU サービスクォータの引き上げを vCPU 値として送信します。クォータ増加を申請するには、まずオンデマンドインスタンスが使用する vCPU の数を決定します。次に、この数値を vCPU ベースのクォータと比較します。これらの値から、リクエストする適切なサービスクォータの引き上げについて判断します。
解決策
オンデマンドインスタンスサービスクォータの引き上げをリクエストする
Service Quotas コンソールまたは AWS サポートセンターを使用して、EC2 サービスクォータの引き上げをリクエストします。
Service Quotas コンソール
EC2 インスタンスのサービスクォータの引き上げをリクエストするには、次の手順を実行します。
- Amazon EC2 コンソールを開きます。
- [AWS リージョン] で、vCPU の引き上げをリクエストするリージョンを選択します。
- Service Quotas コンソールを開きます。
- [Amazon Elastic Compute Cloud (Amazon EC2)] を選択します。
- インスタンスタイプのサービスクォータの名前を選択します。次に、[アカウントレベルでの引き上げをリクエスト] または [リソースレベルでの引き上げをリクエスト] を選択します。
- [クォータ値を引き上げる] に新しい値を入力し、[リクエスト] を選択します。
AWS サポートセンター
EC2 インスタンスのサービスクォータの引き上げをリクエストするには、次の手順を実行します。
- AWS サポートセンターを開きます。
- [ケースを作成] を選択します。
- [サービスクォータを引き上げますか?] を選択します。
- [サービス] で、[EC2 インスタンス] を選択してプロンプトに従います。
重要: EC2 サービスクォータは、一度に 1 つの AWS リージョンにのみ影響します。リソースを増やす必要があるリージョンごとに、サービスクォータの引き上げをリクエストしてください。
- (オプション) ** EC2 インスタンス**に対して複数のサービスクォータの引き上げをリクエストするには、1 つのクォータ引き上げリクエストを完了してから [別のリクエストを追加] を選択します。
サービスクォータの引き上げをリクエストする前に、vCPU 値を計算します。詳細については、次のシナリオと計算の例を参照してください。
サービスクォータのシナリオと計算の例
シナリオ 1: G インスタンスを実行しておらず、3 つの g4dn.xlarge インスタンスを起動したいと考えています。
現在の vCPU 制限は、「G インスタンスと VT インスタンスをオンデマンドで実行 = 8 vCPU」です。
g4dn.xlarge インスタンスは 4 つの vCPU に相当します。アカウントでは 8 個の G インスタンス制限に基づいて、既に 2 つの g4dn.xlarge インスタンスを実行できます。
このシナリオでは、12 個の vCPU (3 x 4) の vCPU サービスクォータ引き上げリクエストを送信します。
Service Quotas コンソールまたは AWS サポートセンターから、次の形式でクォータ引き上げをリクエストします。
**サービス:**Amazon Elastic Compute Cloud (Amazon EC2) インスタンス、または EC2 インスタンス
リージョン: お使いのリージョン
**クォータ名またはプライマリインスタンスタイプ:**G インスタンスおよび VT インスタンス、またはすべての G インスタンスをオンデマンドで実行
**新しい制限値:**12
**シナリオ 2:**64 個の vCPU のインスタンスを実行しています。さらに 2 つの m5.2xlarge インスタンスとさらに 2 つの m4.10xlarge インスタンスを起動したいと考えています。
現在の vCPU 制限は、「すべての標準 (A、C、D、H、I、M、R、T、Z) インスタンスをオンデマンド実行 = 64 vCPU」です。
起動するインスタンスタイプは両方とも「すべての標準 (A、C、D、H、I、M、R、T、Z) インスタンス」の制限に含まれています。これらのインスタンスタイプの使用量はまとめて追加され、1 つのクォータになります。これら 2 つのインスタンスのインスタンスから vCPU への変換率は次のとおりです。
- *.2xlarge インスタンス = インスタンスあたり 8 vCPU
- *.10xlarge インスタンス = インスタンスあたり 40 vCPU
次の計算式を使用して vCPU の数を決定します。
(2 x 8) + (2 x 40) = 96
アカウントですでに 64 個の vCPU 分のインスタンスを実行している場合は、さらに 96 個の vCPU が必要です。
このシナリオでは、160 個の vCPU (64 + 96) 以上の vCPU サービスクォータの引き上げリクエストを送信します。
Service Quotas コンソールまたは AWS サポートセンターから、次の形式でクォータ引き上げをリクエストします。
**サービス:**Amazon Elastic Compute Cloud (Amazon EC2) インスタンス、または EC2 インスタンス
リージョン: お使いのリージョン
**クォータ名またはプライマリインスタンスタイプ:**オンデマンドスタンダード (A、C、D、H、I、M、R、T、Z) インスタンスまたはすべての標準 (A、C、D、H、I、M、R、T、Z) インスタンスの実行
**新しい制限値:**160
シナリオ 3: より強力なインスタンスタイプをテストしたいものの、必要なインスタンスがどれなのかがわかりません。そのため、サービスクォータ引き上げリクエストには柔軟性を持たせる必要があります。
現在の vCPU 制限は、「P インスタンスをオンデマンド実行 = 64 vCPU」です。
ここでは、1 つのインスタンスタイプから始めて、別のインスタンスに変更することができます。vCPU 制限内であれば、新しいサービスクォータリクエストを送信する必要はありません。
例えば、次の P インスタンスの組み合わせをリクエストするとします。
- 5 つの p3.2xlarge インスタンス + インスタンスあたり 8 つの vCPU = 40 vCPU
- 1 つの p3dn.24xlarge + インスタンスあたり 96 vCPU = 96 vCPU
このシナリオでは、柔軟性を保ちながらサービスクォータ引き上げリクエストを小さく抑えるために、136 vCPU (40 + 96) の vCPU リクエストを送信してます。
AWS サポートセンターを使用して、次の形式でクォータ引き上げをリクエストします。
**サービス:**EC2 インスタンス
リージョン: お使いのリージョン
**クォータ名またはプライマリインスタンスタイプ:**すべての P インスタンス
**新しい制限値:**136
リクエストの処理を効率化するには、[ユースケースの説明] で、必要なインスタンスタイプを指定します。また、異なるインスタンスを並行して使用するのか、一度に 1 つずつ使用するのかについても指定してください。
関連情報
Amazon EC2 の Service Quotas
Requesting a quota increase