怎样解决 Direct Connect BGP 从在线状态变为中断状态的问题

2 分钟阅读
0

我想解决我的边界网关协议(BGP)在空闲状态下从在线到中断的问题。

解决方法

如果您的 BGP 会话中断,请确认是否存在以下问题:

检查 AWS Direct Connect 是否正在进行维护

AWS 维护期间,Direct Connect 连接可能会中断。维护可能只需要几分钟,也可能需要几个小时,在此期间,BGP 连接进入空闲状态。Direct Connect 连接的所有者可以在 Events(活动)部分下的 AWS Personal Health Dashboard 中查看 AWS 维护通知。

要配置 Direct Connect 计划维护通知,请参阅如何获取 Direct Connect 计划维护或事件的通知?

检查 Direct Connect 链路状态

要使您的 BGP 处于在线状态,Direct Connect 物理链路或第 1 层必须同样在线。在 AWS 管理控制台Connections(连接)页面上或使用 CloudWatch 连接状态指标检查 Direct Connect 物理链路。如果物理层出现问题,请对第 1 层(物理层)进行故障排查

确认您是否可以从本地路由对 Amazon 对等 IP 地址使用 Ping 命令

如果您无法对 Amazon 对等 IP 地址使用 Ping 命令,则第 2 层地址解析协议(ARP)未建立。要解决此问题,您需要对第 2 层(数据链路)进行故障排查并确认是否存在以下问题:

  • ARP 在您所在端或合作伙伴所在端翻转。
  • 路径中是否引入了新设备。如果是这样,请确保其是否允许为虚拟接口(VIF)配置的 VLAN。

检查您的客户网关设备上的 BGP 调试日志

BGP 连接中断的原因有很多,调试日志中的 BGP Cease NOTIFICATION 消息子代码或许能帮助您找出原因。以下是常见子码列表及相关的解决方法:

BGP Cease NOTIFICATION 代码 6 子码 1 (6/1)

确认您是否超过了使用本地路由通过 Private 和 Transit VIF BGP 会话发布的通告路由的数量限制。对于 IPv4 和 IPv6,从本地到 AWS Private 或 Transit VIF 的前缀上限为 100。公共 VIF 上每个 BGP 会话的路由上限为 1000。这些限制无法上调。

BGP Cease NOTIFICATION 代码 6 子码 4 (6/4) 和 **BGP Cease NOTIFICATION 代码 6 子码 10 (6/10) **

  • 检查 ConnectionBpsEgressConnectionBpsIngressVirtualInterfaceBpsEgressVirtualInterfaceBpsIngress 等 Amazon CloudWatch 指标,确认比特率未达到最大容量。
  • 检查两个对等方之间的数据包是否丢失。这包括检查路由或防火墙中的指标、接口计数器、CPU、内存、端口利用率和丢包情况。
  • 使用显示接口统计信息检查接口输入和输出错误,例如 CRC、帧、冲突和载波。
  • 检查计数器是否磨损。如果磨损,请清洁或更换光纤跳线和 SFP 模块。

如果还有其他问题,请参阅如何解决 Direct Connect 网络性能问题?

BGP Cease NOTIFICATION 代码 6 子码 6 (6/6)

如果您的客户网关 BGP 环境或 AWS 端的 BGP 设置的配置发生变化,此通知消息便会出现在您的调试日志中。如果该变化发生于 AWS 端,请查看 AWS CloudTrail 和 VIF API UpdateVirtualInterfaceAttributes 的记录活动。查阅此内容后,即可了解是哪个用户更改了配置。

如果双方均未更改配置,请联系 AWS Support。

BGP Cease NOTIFICATION 代码 6 子码 7 (6/7)

您收到此通知,是因为连接存在冲突。如果一对 BGP 扬声器尝试同时建立相互连接并且形成了两个并行连接,则会发生连接冲突。要解决此问题,请完成以下步骤:

  1. 手动关闭客户网关设备上的 BGP 对等连接。等待几分钟,然后重新连接。
  2. 如果此问题经常出现,请将您的客户网关设备配置为 BGP 服务器。客户网关设备不会发起 TCP 握手,但会监听 TCP 端口 179 并接受对等连接请求。

检查本地路由近期的配置更改情况

  • 检查 TCP 端口 179 是否遭到防火墙的拦截。
  • 检查 BGP 配置是否遭到意外修改。确认本地或远程 ASN 号码、MD5 密码和对等 IP 地址。
  • 检查 NAT 配置最近是否有变化(包括 BGP 本地 IP 地址和接口 IP 地址)。如若该配置发生变化,则会导致您的 BGP 由于 MD5 密码不匹配而发生故障。要解决此问题,请拒绝对接口 IP 地址的访问或允许所需网络访问公共接口 IP 地址。

如果您有合作伙伴或“最后一公里”服务提供商,请联系他们并询问他们是否有维护活动。

AWS 官方
AWS 官方已更新 1 年前