Como posso solucionar problemas de perda de pacotes na minha conexão Direct Connect?

8 minuto de leitura
0

Estou usando o AWS Direct Connect para transferir dados. Estou enfrentando perda de pacotes ao transferir dados para minha instância do Amazon Elastic Compute Cloud (Amazon EC2). Preciso isolar a perda de pacotes.

Resolução

A perda de pacotes ocorre quando os pacotes de dados transmitidos não chegam ao destino, resultando em problemas de desempenho da rede. A perda de pacotes é causada pela baixa intensidade do sinal no destino, utilização excessiva do sistema, congestionamento da rede ou configurações incorretas da rota da rede.

Execute as verificações a seguir para seus dispositivos de rede e conexão direta.

Consulte o AWS Personal Health Dashboard para ver a manutenção ou eventos programados

O AWS Personal Health Dashboard exibe informações relevantes sobre os recursos que estão em manutenção e também fornece notificações de atividades. Para obter mais informações, consulte Como posso receber notificações sobre manutenção ou eventos programados do Direct Connect?

Verifique as métricas do endpoint do Direct Connect, do gateway do cliente e do dispositivo intermediário (camada 1)

Com o gateway do cliente e os dispositivos intermediários, o problema pode ser local na rede on-premises ou no caminho de trânsito em direção à AWS. Verifique o seguinte no nó on-premises e nos dispositivos intermediários:

  • O gateway do cliente registra as abas de interface
  • Utilização da CPU para o gateway do cliente quando o problema ocorreu
  • A leitura do sinal luminoso no dispositivo em que a conexão Direct Connect termina
  • O dispositivo que a conexão Direct Connect encerra devido a erros de entrada, erros de enquadramento incremental, erros de redundância cíclica (CRC), runts, gigantes ou limitadores

Verifique as métricas de conexão direta (camada 1)

Verifique as seguintes métricas do Direct Connect:

  • ConnectionErrorCount: Aplique a estatística de soma para essa métrica. Observe que valores diferentes de zero indicam erros no nível MAC no dispositivo da AWS.
  • ConnectionLightLevelTX e ConnectionLightLevelRX: Verifique o sinal luminoso gravado na conexão Direct Connect quando o problema ocorreu. A faixa aceitável está entre -14,4 e 2,50 dBm.
  • Conexão BPSEgress e ConnectionBPSInress: Verifique a quantidade de tráfego na conexão Direct Connect quando ocorreu a perda de pacotes devido ao congestionamento no link. Se você usar 100% da capacidade da interface, poderá ter perda de pacotes, excesso de tráfego.

Para mais informações, consulte Métricas do Direct Connect Connection.

Verifique se há um roteamento subótimo assimétrico (camada 3)

O roteamento assimétrico ocorre quando o tráfego de rede entra por uma conexão e sai por outra conexão. Esse roteamento pode causar perda de pacotes se o firewall on-premises executar o encaminhamento inverso de caminho unicast, o que faz com que o tráfego de rede caia.

  • Se você tiver uma conexão Direct Connect redundante de backup ou uma conexão VPN de backup do AWS Site-to-Site VPN, verifique se há algum roteamento assimétrico que possa estar acontecendo.
  • Suponha que você tenha uma conexão VPN de backup de site a site e tenha anunciado prefixos semelhantes nas conexões Direct Connect e VPN. Nesse caso, o tráfego da AWS para on-premises é roteado por meio do Direct Connect. Para evitar o roteamento assimétrico, certifique-se de enviar o tráfego somente pelo Direct Connect on-premises para a AWS.
  • Se você tiver uma conexão Direct Connect de backup, o roteamento assimétrico pode acontecer dependendo de como você anuncia seus prefixos nas duas conexões do Direct Connect.
  • O roteamento abaixo do ideal com a rede on-premises pode causar perda de pacotes.

Para obter mais informações, consulte Como posso resolver problemas de roteamento assimétrico ao criar uma VPN como backup do Direct Connect em um gateway de trânsito?

Rota de rastreamento bidirecional de ponta a ponta entre o host on-premises e o host da AWS (camada 3)

A execução da rota de rastreamento entre os hosts determina o caminho da rede percorrido em ambas as direções. Os resultados do rastreamento também determinam se o roteamento é assimétrico, balanceado de carga e assim por diante.

1.    Execute o seguinte comando para instalar o traceroute:

Linux:

sudo yum install traceroute

Ubuntu:

sudo apt-get install traceroute

2.    Execute um comando semelhante ao seguinte para o traceroute TCP:

sudo traceroute -T -p <destination Port> <IP of destination host>

Sistema operacional Windows:

  1. Baixe o WinPcap e o tracetcp.
  2. Extraia o arquivo ZIP Tracetcp.
  3. Copie tracetcp.exe para a sua unidade C.
  4. Instale o WinPcap.
  5. Abra o prompt de comando e faça o root do WinPcap na unidade C usando o comando C:\Users\username>cd \.
  6. Execute o tracetcp usando os seguintes comandos: tracetcp.exe hostname:port ou tracetcp.exe ip:port.

Teste MTR bidirecional de ponta a ponta entre o host local e o host da AWS (camada 3)

Os testes MTR são semelhantes aos do traceroute, uma vez que permitem a descoberta de cada roteador no caminho de conexão de rede entre os hosts. Os testes MTR também fornecem informações sobre cada nó no caminho, como perda de pacotes.

Verifique os resultados do MTR para perda de pacotes e latência de rede. Uma porcentagem de perda de rede em um salto pode indicar um problema com o roteador. Alguns provedores de serviços limitam o tráfego ICMP que o MTR usa. Para determinar se a perda de pacotes se deve aos limites de taxa, revise os saltos subsequentes. Se o salto subsequente mostrar uma perda de 0,0%, isso pode indicar o limite da taxa de ICMP.

1.    Execute o seguinte comando para instalar o MTR:

Amazon Linux/RHEL:

$ sudo yum install mtr -y

Ubuntu:

sudo apt install mtr -y

Sistema operacional Windows:

Baixe e instale o WinMTR.

Observação: para o SO Windows, o WinMTR não é compatível com o MTR baseado em TCP.

2.    Para a direção on-premises para AWS, execute o MTR no host on-premises (baseado em ICMP e TCP):

$ mtr -n -c 100 <private IP of EC2> --report
$ mtr -n -T -P <EC2 instance open TCP port> -c 100 <private IP of EC2> --report
  1. Para a direção AWS para on-premises, execute o MTR na instância EC2 (baseada em ICMP e TCP):
$ mtr -n -c 100 <private IP of the local host> --report
$ mtr -n -T -P <local host open TCP port> -c 100 <private IP of the local host> --report

Analise o caminho MTU entre o host on-premises e o host da AWS (camada 3)

A unidade máxima de transmissão (MTU) é o tamanho do maior pacote permitido que foi passado pela conexão de rede. Qualquer pacote maior que o tamanho da MTU é descartado na interface. Portanto, a perda de pacotes pode ocorrer se o pacote for muito grande.

O Path MTU Discovery (PMTUD) determina o caminho do MTU. Para obter mais informações, consulte Path MTU Discovery.

Você pode verificar o caminho MTU entre dois hosts usando o tracepath.

1.    Para a direção on-premises para AWS, execute o tracepath na porta 80 a partir do host local:

$ tracepath -n -p 80 <EC2 private instance IP>

2.    Para a direção AWS para on-premises, execute o tracepath na porta 80 a partir da instância do EC2:

$ tracepath -n -p 80 <private IP of local host>

Verifique possíveis problemas de roteamento com o BGP

A conexão Direct Connect usa o protocolo de roteamento dinâmico Protocolo de Gateway da Borda (BGP) para roteamento e comunicação entre a AWS e on-premises.

Verifique se há oscilações regulares no BGP que possam estar causando perda intermitente de pacotes.

Verifique a idade da rota das rotas aprendidas da AWS para a rede do cliente no dispositivo de gateway do cliente. Quando as rotas são atualizadas no dispositivo de gateway do cliente, a idade da rota é atualizada na tabela de rotas do BGP. Você pode revisar essas informações para verificar se a perda de pacotes ocorreu brevemente quando a rota é atualizada.

Para verificar a idade da rota em um roteador Cisco, execute o seguinte comando:

Router#sh ip bgp 1.1.1.1       
BGP routing table entry for 1.1.1.1/32, version 3
Paths: (1 available, best #1, table default)
  Not advertised to any peer
  Refresh Epoch 1
  64512, (received & used)
    169.254.92.181 from 169.254.92.181 (169.254.92.181)
      Origin IGP, metric 100, localpref 100, valid, external, best
      rx pathid: 0, tx pathid: 0x0
      Updated on Mar 31 2023 08:08:00 UTC    >> Last time that the route was updated

-ou-

Router#sh ip route | in 1.1.1.1
B    1.1.1.1 [20/100] via 169.254.92.181, 01:37:46   >> You can see the route age or when the route was last refreshed

Se você usa uma conexão hospedada, consulte seu parceiro ou provedor de serviços para descobrir se a manutenção do lado deles está causando a perda de pacotes.

Informações relacionadas

Práticas recomendadas para configurar as interfaces de rede

Como posso monitorar a perda e a latência de pacotes da AWS para uma rede local por meio de um gateway da Internet ou gateway NAT?

Resolução de problemas do AWS Direct Connect

Como posso solucionar problemas de desempenho de rede do Direct Connect? Baixe WinPcap e tracetcp.

AWS OFICIAL
AWS OFICIALAtualizada há um ano