Amazon EC2 オンデマンドインスタンスの vCPU サービスクォータの引き上げをリクエストする方法を教えてください。

所要時間2分
0

Amazon Elastic Compute Cloud (Amazon EC2) オンデマンドインスタンスのサービスクォータの引き上げをリクエストして、既存の vCPU クォータと利用可能な vCPU クォータについて把握したいと考えています。

簡単な説明

Amazon EC2 vCPU サービスクォータの引き上げを vCPU 値として送信します。引き上げをリクエストするには、まずオンデマンドインスタンスが使用する vCPU の数を決定します。次に、この数値を vCPU ベースのクォータと比較します。これらの値から、リクエストする適切なサービスクォータの引き上げについて判断します。

解決策

オンデマンドインスタンスサービスクォータの引き上げをリクエストする

Service Quotas コンソールまたは AWS サポートセンターを使用して、EC2 サービスクォータの引き上げをリクエストします。

Service Quotas コンソール

EC2 インスタンスのサービスクォータの引き上げをリクエストするには、次の手順を実行します。

  1. Amazon EC2 コンソールを開きます。
  2. [AWS リージョン] で、vCPU の引き上げをリクエストするリージョンを選択します。
  3. Service Quotas コンソールを開きます。
  4. [Amazon Elastic Compute Cloud (Amazon EC2)] を選択します。
  5. インスタンスタイプのサービスクォータの名前を選択します。次に、[アカウントレベルでの引き上げをリクエスト] または [リソースレベルでの引き上げをリクエスト] を選択します。
  6. [クォータ値を引き上げる] に新しい値を入力し、[リクエスト] を選択します。

AWS サポートセンター

EC2 インスタンスのサービスクォータの引き上げをリクエストするには、次の手順を実行します。

  1. AWS サポートセンターを開きます。
  2. [ケースを作成] を選択します。
  3. [サービスクォータを引き上げますか?] を選択します。
  4. [サービス] で、[EC2 インスタンス] を選択してプロンプトに従います。
    **重要:**EC2 サービスクォータは一度に 1 つの AWS リージョンにのみ影響します。リソースを増やす必要があるリージョンごとに、サービスクォータの引き上げをリクエストしてください。
  5. (オプション) ** EC2 インスタンス**に対して複数のサービスクォータの引き上げをリクエストするには、1 つのクォータ引き上げリクエストを完了してから [別のリクエストを追加] を選択します。

サービスクォータの引き上げをリクエストする前に、vCPU 値を計算します。詳細については、次のシナリオと計算の例を参照してください。

サービスクォータのシナリオと計算の例

シナリオ 1: G インスタンスを実行しておらず、3 つの g4dn.xlarge インスタンスを起動したいと考えています。

現在の vCPU 制限は、「G インスタンスと VT インスタンスをオンデマンドで実行 = 8 vCPU」です。

g4dn.xlarge インスタンスは 4 つの vCPU に相当します。アカウントでは 8 個の G インスタンス制限に基づいて、既に 2 つの g4dn.xlarge インスタンスを実行できます。

このシナリオでは、12 個の vCPU (3 x 4) の vCPU サービスクォータ引き上げリクエストを送信します。

Service Quotas コンソールまたは AWS サポートセンターから、次の形式でクォータ引き上げをリクエストします。

**サービス:**Amazon Elastic Compute Cloud (Amazon EC2) インスタンス、または EC2 インスタンス
リージョン: お住まいのリージョン
**クォータ名またはプライマリインスタンスタイプ:**G インスタンスおよび VT インスタンス、またはすべての G インスタンスをオンデマンドで実行
**新しい制限値:**12

**シナリオ 2:**64 個の vCPU のインスタンスを実行しています。さらに 2 つの m5.2xlarge インスタンスとさらに 2 つの m4.10xlarge インスタンスを起動したいと考えています。

現在の vCPU 制限は、「すべての標準 (A、C、D、H、I、M、R、T、Z) インスタンスをオンデマンド実行 = 64 vCPU」です。

起動するインスタンスタイプは両方とも「すべての標準 (A、C、D、H、I、M、R、T、Z) インスタンス」の制限に含まれています。これらのインスタンスタイプの使用量はまとめて追加され、1 つのクォータになります。これら 2 つのインスタンスのインスタンスから vCPU への変換率は次のとおりです。

  • *.2xlarge インスタンス = インスタンスあたり 8 vCPU
  • *.10xlarge インスタンス = インスタンスあたり 40 vCPU

次の計算式を使用して vCPU の数を決定します。

(2 x 8) + (2 x 40) = 96

アカウントですでに 64 個の vCPU 分のインスタンスを実行している場合は、さらに 96 個の vCPU が必要です。

このシナリオでは、160 個の vCPU (64 + 96) 以上の vCPU サービスクォータの引き上げリクエストを送信します。

Service Quotas コンソールまたは AWS サポートセンターから、次の形式でクォータ引き上げをリクエストします。

**サービス:**Amazon Elastic Compute Cloud (Amazon EC2) インスタンス、または EC2 インスタンス
リージョン: お住まいのリージョン
**クォータ名またはプライマリインスタンスタイプ:**オンデマンドスタンダード (A、C、D、H、I、M、R、T、Z) インスタンスまたはすべての標準 (A、C、D、H、I、M、R、T、Z) インスタンスの実行
**新しい制限値:**160

シナリオ 3: より強力なインスタンスタイプをテストしたいものの、必要なインスタンスがどれなのかがわかりません。そのため、サービスクォータ引き上げリクエストには柔軟性を持たせる必要があります。

現在の vCPU 制限は、「P インスタンスをオンデマンド実行 = 64 vCPU」です。

ここでは、1 つのインスタンスタイプから始めて、別のインスタンスに変更することができます。vCPU 制限内であれば、新しいサービスクォータリクエストを送信する必要はありません。

例えば、次の P インスタンスの組み合わせをリクエストするとします。

  • 5 つの p3.2xlarge インスタンス + インスタンスあたり 8 つの vCPU = 40 vCPU
  • 1 つの p3dn.24xlarge + インスタンスあたり 96 vCPU = 96 vCPU

このシナリオでは、柔軟性を保ちながらサービスクォータ引き上げリクエストを小さく抑えるために、136 vCPU (40 + 96) の vCPU リクエストを送信してます。

AWS サポートセンターを使用して、次の形式でクォータ引き上げをリクエストします。

**サービス:**EC2 インスタンス
リージョン: お住まいのリージョン
**クォータ名またはプライマリインスタンスタイプ:**すべての P インスタンス
**新しい制限値:**136

リクエストの処理を効率化するには、[ユースケースの説明] で、必要なインスタンスタイプを指定します。また、異なるインスタンスを並行して使用するのか、一度に 1 つずつ使用するのかについても指定してください。

関連情報

Amazon EC2 の Service Quotas

Requesting a quota increase

AWS公式
AWS公式更新しました 3ヶ月前
コメントはありません