如何使用 CloudWatch 指标来确定 NAT 网关带宽问题?

2 分钟阅读
0

我的 NAT 网关带宽不符合预期。我想使用 Amazon CloudWatch 指标来确定带宽问题。

解决方法

对网络吞吐量进行基准测试

完成以下步骤:

  1. 设置测试环境,以对同一 Amazon Virtual Private Cloud (Amazon VPC) 中的 Amazon Elastic Compute Cloud (Amazon EC2) Linux 实例之间的网络吞吐量进行基准测试
  2. 对实例可以管理的流量进行基准测试。
  3. 对在 NAT 网关后面运行的不同实例类型重复上述步骤。要确定实例类型,请参阅本文的“检查 NAT 网关后面的实例”部分。

查看 CloudWatch 指标,以了解吞吐量或 NAT 网关带宽方面的问题

完成以下步骤:

  1. 打开 CloudWatch 控制台
  2. 在导航窗格中,选择 Metrics(指标)。
  3. 选择 NAT 网关,然后检查 PacketsDropCount 指标的值是否大于零。
  4. 选择 NAT 网关,然后检查 ErrorPortAllocation 指标的值是否大于零。
  5. 选择 BytesOutToDestinationBytesOutToSourceBytesInFromDestinationBytesInFromSource
  6. 选择 PeakPacketsPerSecond
    注意:请检查最大统计数据以确定 60 秒内每 10 秒的平均数据包速率。

对于正常运行的 NAT 网关,该指标值始终为零。如果该值大于零,则表示 NAT 网关当前存在暂时性问题。查看 AWS Health Dashboard,了解与 NAT 网关相关的通知。如果没有通知,请向 AWS Support 提交案例。

要计算 1 分钟间隔内的平均带宽,请使用以下公式之一。以下公式给出了一段时间内的平均带宽,但未提供每秒带宽的实际视图。根据您的使用模式,每秒带宽可能会出现峰值和低谷。您的 NAT 网关会根据流量的波动进行扩展。

[( BytesOutToDestination + BytesOutToSource) * 8 / 时间段(以秒为单位)]。

[( BytesInFromDestination + BytesInFromSource) * 8 / 时间段(以秒为单位)]

**注意:**如果带宽突增超过 100 Gbps,请将资源分配到多个子网并创建多个 NAT 网关。为了获得最佳性能,请在与 NAT 网关位于同一可用区的私有子网之间创建实例。

检查 NAT 网关后面的实例

完成以下步骤:

  1. 打开 Amazon VPC 控制台
  2. 在导航窗格中的 Route tables(路由表)下,选择指向 NAT 网关的路由表。
  3. 选择 Subnet association(子网关联)视图,然后记下所有子网 ID。
  4. 打开 Amazon EC2 控制台
  5. 在导航窗格中的 Instances(实例)下,选择 Settings(设置)图标以查看 Show(显示)列和 Hide(隐藏)列。
  6. 选择 Subnet ID(子网 ID)和 Instance type(实例类型)。
  7. 确定在关联子网中运行的所有实例的 ID。

检查 NAT 网关后面的所有 Amazon EC2 实例的 CloudWatch 指标

完成以下步骤:

  1. 打开 Amazon CloudWatch 控制台
  2. 在导航窗格中的 Metrics(指标)下,选择 EC2
  3. 选择 NAT 网关后面的所有实例的 ID。
  4. Metric name(指标名称)列下,选择在遇到带宽问题期间受到影响的所有实例的 NetworkInNetworkOutCPUUtilization 指标。
    **注意:**有关如何检查流量使用情况的说明,请参阅获取特定资源的统计数据
  5. 确认在出现带宽问题的同时没有出现 CPU 激增或流量异常增加。
  6. 在子网级别激活 VPC 流日志以查看流经 NAT 网关的流量。

比较结果

检查 NAT 网关后面所有实例的网络吞吐量指标总和是否超过 100 Gbps 突增。如果突增超过 100 Gbps,则 NAT 网关的带宽将大于 100 Gbps 配额。在这种情况下,最佳做法是将流量分配到多个 NAT 网关。

相关信息

如何在 Amazon VPC 中为私有子网设置 NAT 网关?

NAT 网关

为什么私有子网中的 Amazon EC2 实例无法使用 NAT 网关连接到互联网?

比较 NAT 网关和 NAT 实例

AWS 官方
AWS 官方已更新 2 个月前