내용으로 건너뛰기

Direct Connect에서 계층 3 문제를 해결하려면 어떻게 해야 합니까?

5분 분량
0

계층 3 문제로 인해 가동이 중단되는 AWS Direct Connect 연결 문제를 해결하고 싶습니다.

해결 방법

참고: 계층 1 문제에 대한 내용은 Direct Connect에서 계층 1 문제를 해결하려면 어떻게 해야 합니까?를 참조하십시오. 계층 2 문제에 대한 내용은 Direct Connect에서 계층 2 문제를 해결하려면 어떻게 해야 합니까?를 참조하십시오.

AWS Health Dashboard에서 유지 관리 활동 확인

Direct Connect 연결은 몇 분에서 몇 시간까지 지속될 수 있는 지속적인 AWS 유지 관리로 인해 DOWN 상태가 될 수 있습니다. 유지 관리 중에는 Border Gateway Protocol(BGP) 연결이 유휴 상태로 전환됩니다.

AWS Health Dashboard이벤트 섹션에서 진행 중이거나 최근에 완료된 AWS 유지 관리 중 Direct Connect 연결에 영향을 줄 수 있는 유지 관리가 있는지 확인하십시오.

즉각적인 알림을 받을 수 있도록 중요 지표에 대한 알림을 설정하십시오.

BGP 구성 확인

가상 인터페이스 상태를 확인할 수 있지만 BGP 연결을 설정할 수 없는 경우 다음 작업을 수행하십시오.

  • 로컬 BGP Autonomous System Number(ASN) 및 AWS ASN에 구성 문제가 있는지 확인하십시오.
  • BGP 피어링 세션의 양쪽에서 피어 IP 주소에 구성 문제가 있는지 확인합니다.
  • 다운로드한 라우터 구성 파일의 키와 일치하도록 MD5 인증 키를 구성합니다. 키에 추가 공백이나 문자가 없는지 확인합니다.
  • 프라이빗 가상 인터페이스의 경우 100개 이상의 접두사 또는 퍼블릭 가상 인터페이스의 경우 1,000개 이상의 접두사를 광고하지 마십시오.
    참고: 이러한 할당량은 수정하거나 초과할 수 없습니다.
  • TCP 포트 179 또는 번호가 높은 임시 TCP 포트를 차단하는 방화벽 또는 네트워크 액세스 제어 목록(네트워크 ACL) 규칙을 비활성화합니다.
    참고: 이러한 포트는 BGP가 피어 간에 TCP 연결을 설정하는 데 필요합니다.
  • BGP 로그에서 오류나 경고 메시지를 확인하십시오.

위 단계로도 BGP 문제가 해결되지 않으면 다음 작업을 수행하십시오.

  • 게이트웨이에 BGP를 올바르게 구성했는지 확인합니다.
  • BGP 피어 IP 주소 간에 핑 테스트를 수행합니다.
  • 게이트웨이 디바이스의 BGP 피어 IP 주소 간 트래픽에 대한 패킷 캡처를 수집합니다.

BGP 상태 문제 해결

BGP를 올바르게 구성했는데도 여전히 계층 3 문제가 발생하는 경우 BGP 상태 문제를 해결하십시오.

참고: 유휴 상태는 BGP가 시작 이벤트를 기다리는 첫 번째 상태입니다. 시작 이벤트는 새 BGP 이웃을 구성하거나 기존 BGP 피어링 세션을 재설정할 때 발생합니다. BGP는 리소스를 초기화하고 ConnectRetry 타이머를 재설정하고 원격 BGP 이웃에 대한 TCP 연결을 시작합니다.

연결 상태

연결 상태에서 BGP는 TCP 3방향 핸드셰이크가 완료될 때까지 기다립니다. 핸드셰이크가 성공하면 연결이 OpenSent 상태로 전환됩니다.

성공적인 연결의 예:

2021-07-04 22:50:20 169.254.60.146 169.254.60.145 TCP 74 34516 → 179 [SYN] Seq=0 Win=2920 Len=0 MSS=1460 SACK_PERM TSval=3030456 TSecr=0 WS=1
2021-07-04 22:50:20.719228 169.254.60.145 169.254.60.146 TCP 74    179 → 34516 [SYN, ACK] Seq=0 Ack=1 Win=26844 Len=0 MSS=1375 TSval=64921081 TSecr=3030456 WS=128
2021-07-04 22:50:20.719453 169.254.60.146 169.254.60.145 TCP 66    34516 → 179 [ACK] Seq=1 Ack=1 Win=2920 Len=0 TSval=3030476 TSecr=64921081

연결 또는 ConnectRetry가 실패하면 연결은 활성 상태로 유지되고 OpenSent 상태로 전환되지 않습니다.

연결 상태 문제를 해결하려면 다음 작업을 수행하십시오.

  • 두 BGP 인접 디바이스 간에 TCP 연결이 설정되어 있는지 확인하려면 TCP 포트 179에서 텔넷 테스트를 실행합니다. TCP 연결이 없는 경우 TCP 연결 중에 발생한 오류나 손실된 패킷이 있는지 로그에서 확인합니다.
  • BGP, 게이트웨이 및 AWS에서 BGP 인접 디바이스의 IP 주소를 올바르게 구성했는지 확인합니다.
  • 라우터에 올바른 BGP 인증을 입력했는지 확인합니다.

OpenSent 상태

BGP는 피어에게 OPEN 메시지를 보낸 후 OpenSent 상태에서 OPEN 응답을 기다립니다. BGP가 성공적으로 응답을 수신하면 BGP 상태가 OpenConfirm 상태로 전환되고 피어에게 keepalive 메시지를 보냅니다. 연결에 실패하면 BGP가 유휴 또는 활성 상태로 돌아갑니다.

BGP가 연결을 설정하지 않는 경우 로그에서 BGP 인접 디바이스가 보내고 받은 OPEN 메시지(BGP 파라미터 포함)를 확인하십시오.

OPEN 메시지 예시:

Border Gateway Protocol - OPEN MessageType: OPEN Message (1)  
Version: 4   
My AS: 65000  
Hold Time: 30  
BGP Identifier: 54.241.242.80

또한 OpenSent 로그를 확인하여 실패 원인을 파악하십시오.

참고: AWS는 대기 시간 값으로 0을 허용하지 않습니다.

OpenConfirm 상태

BGP는 피어로부터 keepalive 메시지를 받을 때까지 OpenConfirm 상태로 대기합니다. BGP가 메시지를 성공적으로 수신하면 상태가 설정됨으로 전환됩니다. 그렇지 않으면 상태가 유휴 또는 활성 상태로 돌아갑니다.

로그에서 피어가 keepalive 메시지를 보냈고 BGP가 수신했는지 확인합니다.

BGP 피어 간의 keepalive 메시지 예시:

65    2021-07-04 22:50:20.744297    169.254.60.146    169.254.60.145    BGP    85    KEEPALIVE Message
66    2021-07-04 22:50:20.765323    169.254.60.145    169.254.60.146    BGP    85    KEEPALIVE Message

설정됨 상태

설정됨 상태에서는 BGP가 피어 간에 정보를 교환합니다.

BGP 업데이트 메시지 예시:

Border Gateway Protocol - UPDATE Message
Path attributes
Path Attribute - AS_PATH: 65000
Path Attribute - NEXT_HOP: 169.254.60.146
Network Layer Reachability Information (NLRI)
   192.168.0.0/16

BGP가 연결을 설정하지 않는 경우 다음 작업을 수행하십시오.

  • 로그를 확인하여 라우터가 업데이트를 올바르게 교환하는지 확인합니다. 광고된 접두사가 예상 경로와 일치하는지 확인합니다.
  • BGP 필터 또는 접두사 목록이 라우팅 테이블 내 경로 전파를 막지 않는지 확인합니다.
  • 피어 라우팅 테이블에 광고된 경로 항목이 올바른지 확인합니다.
  • 가상 게이트웨이의 Direct Connect 가상 인터페이스에서 BGP 피어링 세션이 설정됨 상태에서 유휴 상태로 변경된 것이 BGP 로그 또는 온프레미스 디바이스에 표시될 수 있습니다. 이 경우 피어가 BGP 피어링 세션을 통해 100개 미만의 경로를 광고해야 합니다.

BFD 문제 해결

AWS는 AWS의 Direct Connect 가상 인터페이스에 대해 비동기 양방향 전달 감지(BFD)를 자동으로 켭니다.

BFD 문제를 해결하려면 다음 작업을 수행하십시오.

  • 라우터에서 BFD를 활성화한 경우 BFD를 올바르게 구성했는지 확인하십시오.
  • BFD 피어링 세션이 라우터에서 UP 상태인지 확인합니다.
  • 라우터의 BFD 이벤트 또는 로그를 검토합니다.

참고: AWS의 기본 BFD 활성 상태 감지 최소 간격은 300밀리초(ms)입니다. 기본 BFD 활성 상태 감지 승수는 3입니다.

장애 조치 또는 연결 문제를 방지하려면 정상 재시작과 BFD를 동시에 구성하지 않는 것이 좋습니다. 빠른 장애 조치를 위해 정상 재시작 기능을 끈 상태로 BFD를 구성하십시오.

관련 정보

계층 3/4(네트워크/전송) 문제 해결

AWS 공식업데이트됨 5달 전
댓글 없음