CloudWatch メトリクスを使用して NAT ゲートウェイの帯域幅の問題を特定する方法を教えてください。

所要時間2分
0

NAT ゲートウェイの帯域幅が期待したとおりのものではありません。Amazon CloudWatch メトリクスを使用して帯域幅の問題を特定したいです。

解決策

ネットワークスループットのベンチマーク

次の手順を実行します。

  1. テスト環境をセットアップして、同じ Amazon Virtual Private Cloud (Amazon VPC) にある Amazon Elastic Compute Cloud (Amazon EC2) Linux インスタンス間のネットワークスループットのベンチマークを実施します。
  2. インスタンスが管理できるトラフィックのベンチマークを行います。
  3. NAT ゲートウェイの背後で実行している各インスタンスタイプについて、上記手順を繰り返します。インスタンスタイプを特定するには、この記事内の「NAT ゲートウェイの背後にあるインスタンスを確認する」セクションを参照してください。

CloudWatch メトリクスで、スループットや NAT ゲートウェイの帯域幅に関する問題について確認する

次の手順を実行します。

  1. CloudWatch コンソールを開きます。
  2. ナビゲーションペインで [メトリクス] を選択します。
  3. NAT ゲートウェイを選択し、PacketsDropCount メトリクスの値にゼロより大きいものがあるかどうかを確認します。
  4. NAT ゲートウェイを選択し、ErrorPortAllocation メトリクスの値にゼロより大きいものがあるかどうかを確認します。
  5. BytesOutToDestinationBytesOutToSourceBytesInFromDestinationBytesInFromSource を選択します。
  6. PeakPacketsPerSecond を選択します。
    注: 統計情報 maximum を確認し、60 秒間における 10 秒ごとの平均パケットレートを判定します。

正常な NAT ゲートウェイの場合、値は常にゼロです。この値が 0 より大きい場合は、NAT ゲートウェイに一時的な問題が発生中です。AWS Health Dashboard で NAT ゲートウェイに関連する通知を確認します。通知がない場合は、AWS サポートでケースを開始してください。

次のいずれかの式で、1 分間隔での平均帯域幅を計算します。次の式では、一定期間における平均帯域幅を取得できますが、実際の 1 秒あたりの帯域幅ではありません。使用パターンによっては、1 秒あたりの帯域幅が急に増加したり減少したりする場合があります。NAT ゲートウェイはトラフィックの変動に応じてスケーリングします。

[( BytesOutToDestination + BytesOutToSource) * 8 / 秒単位の期間]

[( BytesInFromDestination + BytesInFromSource) * 8 / 秒単位の期間]

注: 帯域幅のバーストが 100 Gbps を超える場合は、リソースを複数のサブネットに分散し、複数の NAT ゲートウェイを作成します。最適なパフォーマンスを得るには、NAT ゲートウェイと同じアベイラビリティーゾーンにあるプライベートサブネットにインスタンスを作成します。

NAT ゲートウェイの背後にあるインスタンスを確認する

次の手順を実行します。

  1. Amazon VPC コンソールを開きます。
  2. ナビゲーションペインの [ルートテーブル] で、NAT ゲートウェイを指しているルートテーブルを選択します。
  3. [サブネットの関連付け] ビューを選択し、すべてのサブネット ID を書き留めます。
  4. Amazon EC2 コンソールを開きます。
  5. ナビゲーションペインの [インスタンス][設定] アイコンをクリックすると、列の [表示][非表示] メニューが表示されます。
  6. [サブネット ID][インスタンスタイプ] を選択します。
  7. 関連するサブネットで実行されているすべてのインスタンスの ID を特定します。

NAT ゲートウェイの背後にあるすべての Amazon EC2 インスタンスの CloudWatch メトリクスを確認する

次の手順を実行します。

  1. Amazon CloudWatch コンソールを開きます。
  2. ナビゲーションペインの [メトリクス][EC2] を選択します。
  3. NAT ゲートウェイの背後にあるすべてのインスタンスの ID を選択します。
  4. [メトリクス名] 列で、帯域幅の問題が発生した期間中に影響を受けたすべてのインスタンスの NetworkInNetWorkoutCPUUtilization メトリクスを選択します。
    注: トラフィックの使用状況を確認する方法については、「特定のリソースの統計情報を取得する」を参照してください。
  5. 帯域幅の問題と同時期に、CPU 使用率の急増やトラフィックの異常な増加がないことを確認します。
  6. サブネットレベルで VPC フローログを有効化し、NAT ゲートウェイを通過するトラフィックを確認します。

結果を比較する

NAT ゲートウェイの背後にあるすべてのインスタンスのネットワークスループットメトリクスの合計が 100 Gbps のバーストを超えているかどうかを確認します。バーストが 100 Gbps を超える場合、NAT ゲートウェイの帯域幅は 100 Gbps クォータを超えています。この場合、トラフィックを複数の NAT ゲートウェイに分散するのがベストプラクティスです。

関連情報

Amazon VPC のプライベートサブネットに NAT ゲートウェイを設定する方法を教えてください。

NAT ゲートウェイ

プライベートサブネットの Amazon EC2 インスタンスが NAT ゲートウェイを使用してインターネットに接続できない理由を知りたいです。

NAT ゲートウェイと NAT インスタンスの比較

AWS公式
AWS公式更新しました 5ヶ月前
コメントはありません