Amazon Aurora PostgreSQL 호환 클러스터가 장애 조치된 이유는 무엇인가요?

3분 분량
0

Amazon Aurora PostgreSQL 호환 버전 DB 클러스터가 장애 조치되는 원인이 무엇인지 알고 싶습니다.

간략한 설명

Aurora PostgreSQL 호환 기능은 다음 시나리오에서 클러스터 리더 중 하나에 대한 인스턴스 장애 조치를 자동으로 수행합니다.

  • 라이터(Writer) 인스턴스의 인프라 문제. 여기에는 물리적 호스트와의 네트워크 연결 손실, 클러스터 볼륨에 대한 네트워크 연결 손실 또는 물리적 컴퓨팅 리소스 관련 문제가 포함됩니다.
  • 라이터 인스턴스에 연결 불가. 이 문제는 과도한 워크로드와 관련이 있으며, 이로 인해 성능 병목 현상 및 리소스 경합이 발생합니다.
  • 라이터의 DB 인스턴스 클래스 유형DB 인스턴스 수직 크기 조정 활동의 일부로 변경됩니다.
  • 특정 유지 관리 기간 동안 Aurora 라이터 인스턴스의 기본 호스트에 소프트웨어 패칭, 하드웨어 유지 관리 또는 OS 업데이트가 적용되고 있습니다. 자세한 내용은 Amazon Aurora DB 클러스터 유지 관리를 참조하세요.
  • 인스턴스 수준에서 failover(장애 조치) 옵션을 사용하여 인스턴스가 장애 조치되었습니다.

클러스터의 라이터가 상태 확인에 응답하지 못하면 클러스터는 할당된 우선순위에 따라 클러스터 리더 중 하나에 대한 장애 조치를 시작합니다. 자세한 내용은 Amazon Aurora PostgreSQL 장애 조치를 참조하세요.

해결 방법

장애 조치의 원인을 알아보려면 Aurora PostgreSQL 호환 클러스터에 대한 다음 로그 및 지표를 확인하세요.

Amazon RDS 이벤트

계획되지 않은 중단의 근본 원인을 알아보려면 장애 조치 기간의 모든 Amazon Relational Database Service(RDS) 이벤트를 확인하세요. 모든 이벤트는 기본적으로 UTC/GMT 시간 기준으로 등록됩니다. 이벤트를 더 오래 저장하려면 Amazon RDS 이벤트를 Amazon CloudWatch Events로 전송합니다. 자세한 내용은 Amazon Aurora 이벤트에서 트리거되는 규칙 생성을 참조하세요.

Amazon CloudWatch 지표

Aurora PostgreSQL 호환 클러스터의 Amazon CloudWatch 지표를 확인하여 높은 데이터베이스 부하로 인해 중단이 발생했는지 확인합니다. 자세한 내용은 Amazon CloudWatch로 Amazon Aurora 지표 모니터링을 참조하세요. 클러스터/인스턴스의 가용성 및 상태를 나타내는 다음 주요 지표에서 급증이 있는지 확인합니다.

  • DatabaseConnections
  • CPUUtilization
  • FreeableMemory
  • DiskQueueDepth

Enhanced Monitoring

Amazon Aurora 인스턴스에 대해 Enhanced Monitoring을 켜려면 Enhanced Monitoring 설정 및 활성화를 참조하세요.

Amazon RDS는 DB 인스턴스가 실행되는 OS에 대한 실시간 지표를 제공합니다. 콘솔에서는 PostgreSQL 인스턴스에 대한 모든 시스템 지표와 프로세스 정보를 볼 수 있습니다. 인스턴스별로 모니터링하려는 지표를 관리하고, 요구 사항에 따라 대시보드를 변경할 수 있습니다. Enhanced Monitoring 지표에 대한 설명은 Enhanced Monitoring의 OS 지표를 참조하세요.

성능 개선 도우미

성능 개선 도우미는 기존 Amazon Aurora 모니터링 기능을 확장하여 클러스터 성능을 설명하고 분석하는 데 도움을 줍니다. 성능 개선 도우미 대시보드를 사용하면 Aurora PostgreSQL 호환 클러스터 부하에 대한 데이터베이스 부하를 시각화할 수 있습니다. 대기, SQL 문, 호스트 또는 사용자별로 부하를 필터링할 수 있습니다.

자세한 내용은 Amazon Aurora의 성능 개선 도우미를 통한 DB 부하 모니터링성능 개선 도우미 대시보드를 사용한 지표 분석을 참조하세요.

Aurora 데이터베이스 로그

온프레미스 데이터베이스에서 DB 로그는 파일 시스템에 있습니다. Amazon RDS와 Amazon Aurora는 Aurora PostgreSQL 호환 클러스터의 파일 시스템에 있는 DB 로그에 대한 호스트 액세스 권한을 부여하지 않습니다. Amazon CloudWatch Logs를 사용하여 로그 데이터를 분석할 수 있습니다. 자세한 내용은 Amazon CloudWatch Logs에 Aurora PostgreSQL 로그 게시를 참조하세요.

AWS Management Console을 사용하여 로그 파일을 볼 수도 있습니다. 자세한 내용은 데이터베이스 로그 파일 조사를 참조하세요.

Amazon Aurora PostgreSQL 호환 빠른 장애 조치

DB 클러스터에서 장애 조치가 최대한 빨리 이루어지도록 하려면 Amazon Aurora PostgreSQL을 사용한 빠른 장애 조치를 참조하세요.

Aurora PostgreSQL 호환 클러스터 캐시 관리를 통한 장애 조치 후 빠른 복구

장애 조치 후 라이터 DB 인스턴스가 빠르게 복구되도록 하려면 장애 조치 후 Aurora PostgreSQL용 클러스터 캐시 관리를 통한 신속한 복구를 참조하세요.


관련 정보

Amazon Aurora의 고가용성

Amazon Aurora 클러스터에서 지표 모니터링

Amazon RDS 이벤트 범주 및 이벤트 메시지

AWS 공식
AWS 공식업데이트됨 일 년 전