Warum hat mein Amazon-Aurora-PostgreSQL-kompatibler Cluster ein Failover durchgeführt?

Lesedauer: 4 Minute
0

Ich möchte wissen, was zu einem Failover meines Amazon-Aurora-PostgreSQL-kompatiblen Edition-DB-Clusters geführt hat.

Kurzbeschreibung

Aurora PostgreSQL-Compatible führt in den folgenden Szenarien automatisch ein Instance-Failover zu einem seiner Cluster-Reader durch:

  • Infrastrukturproblem mit der Schreiber-Instance. Dazu gehören der Verlust der Netzwerkkonnektivität zum physischen Host, der Verlust der Netzwerkkonnektivität zum Cluster-Volume oder Probleme mit den physischen Rechenressourcen.
  • Die Schreiber-Instance ist nicht erreichbar. Dieses Problem ist mit einem übermäßigen Workload verbunden, der zu Leistungsengpässen und Ressourcenkonflikten führt.
  • Der DB-Instance-Klassentyp des Schreibers wird im Rahmen der vertikalen Skalierung der DB-Instance geändert.
  • Der zugrunde liegende Host der Aurora-Schreiber-Instance wird während eines bestimmten Wartungsfensters einem Software-Patching, einer Hardwarewartung oder einem Betriebssystem-Update unterzogen. Weitere Informationen finden Sie unter Wartung eines Amazon-Aurora-DB-Clusters.
  • Für die Instance wurde mithilfe der **Failover-**Option auf Instance-Ebene ein Failover durchgeführt.

Wenn der Schreiber des Clusters nicht auf Zustandsprüfungen reagiert, startet der Cluster auf der Grundlage der ihm zugewiesenen Priorität einen Failover zu einem der Lesegeräte des Clusters. Weitere Informationen finden Sie unter Failover mit Amazon Aurora PostgreSQL.

Lösung

Um den Grund für den Failover zu ermitteln, überprüfen Sie die folgenden Protokolle und Metriken für Ihren Aurora-PostgreSQL-kompatiblen Cluster.

Amazon-RDS-Ereignisse

Um die Ursache eines ungeplanten Ausfalls zu ermitteln, sehen Sie sich alle Amazon-Relational-Database-Service-Ereignisse (Amazon RDS) aus dem Failover-Zeitraum an. Alle Ereignisse werden standardmäßig in der UTC/GMT-Zeit registriert. Wenn Sie Ereignisse für einen längeren Zeitraum speichern möchten, senden Sie die Amazon-RDS-Ereignisse an Amazon CloudWatch Events. Weitere Informationen finden Sie unter Erstellen einer Regel, die bei einem Amazon-Aurora-Ereignis ausgelöst wird.

Amazon-CloudWatch-Metriken

Sehen Sie sich die Amazon-CloudWatch-Metriken für Ihren Aurora-PostgreSQL-kompatiblen Cluster an, um zu überprüfen, ob die hohe Datenbanklast den Ausfall verursacht hat. Weitere Informationen findest du unter Überwachen von Amazon-Aurora-Metriken mit Amazon CloudWatch. Überprüfen Sie, ob die folgenden Metriken, die die Verfügbarkeit und den Zustandsstatus Ihres Cluster/Ihrer Instance angeben, auf Spitzen hinweisen:

  • Datenbankverbindungen
  • CPUUtilization
  • FreeableMemory
  • DiskQueueDepth

Enhanced Monitoring

Informationen zum Aktivieren von Enhanced Monitoring für Ihre Amazon-Aurora-Instances finden Sie unter Einrichten und Aktivieren von Enhanced Monitoring.

Amazon RDS liefert Metriken in Echtzeit für das Betriebssystem, auf dem Ihre DB-Instance läuft. Sie können alle Systemmetriken und Prozessinformationen für Ihre PostgreSQL-Instances auf der Konsole anzeigen. Sie können festlegen, welche Metriken Sie für jede Instance überwachen wollen, und dann das Dashboard an Ihre Anforderungen anpassen. Eine Beschreibung der Enhanced-Monitoring-Metriken finden Sie unter Betriebssystemmetriken in Enhanced Monitoring.

Performance Insights

Performance Insights erweitert die vorhandenen Amazon-Aurora-Überwachungsfunktionen, um Ihre Cluster-Leistung zu veranschaulichen und Ihnen bei der Analyse zu helfen. Mithilfe des Performance-Insights-Dashboards können Sie die Datenbanklast auf Ihrer Aurora-PostgreSQL-kompatiblen Clusterlast visualisieren. Sie können die Last nach Wartezeiten, SQL-Anweisungen, Hosts oder Benutzern filtern.

Weitere Informationen finden Sie unter Überwachen der DB-Auslastung mit Performance Insights auf Amazon Aurora und Analysieren von Metriken mit dem Performance-Insights-Dashboard.

Aurora-Datenbankprotokolle

In Datenbanken vor Ort befinden sich die DB-Protokolle im Dateisystem. Amazon RDS und Amazon Aurora gewähren dem Host keinen Zugriff auf die DB-Protokolle im Dateisystem Ihrer Aurora-PostgreSQL-kompatiblen Cluster. Sie können Amazon CloudWatch Logs verwenden, um die Protokolldaten zu analysieren. Weitere Informationen finden Sie unter Veröffentlichen von Aurora-PostgreSQL-Protokollen in Amazon CloudWatch Logs.

Sie können eine Protokolldatei auch mithilfe der AWS-Managementkonsole ansehen. Weitere Informationen finden Sie unter Überwachung einer Datenbank-Protokolldatei.

Schnelles Failover mit Amazon Aurora PostgreSQL-Compatible

Um sicherzustellen, dass das Failover in Ihren DB-Clustern so schnell wie möglich erfolgt, siehe Schnelles Failover mit Amazon Aurora PostgreSQL.

Schnelle Wiederherstellung nach einem Failover mit Cluster-Cache-Management für Aurora PostgreSQL-Compatible

Um sicherzustellen, dass Ihre Schreiber-DB-Instance nach einem Failover schnell wiederhergestellt wird, siehe Schnelle Wiederherstellung nach einem Failover mit Cluster-Cache-Management für Aurora PostgreSQL.


Ähnliche Informationen

Hohe Verfügbarkeit für Amazon Aurora

Überwachung von Metriken in einem Amazon-Aurora-Cluster

Amazon-RDS-Ereigniskategorien und Ereignisnachrichten

AWS OFFICIAL
AWS OFFICIALAktualisiert vor einem Jahr