Direkt zum Inhalt

Wie behebe ich unerwartete Neustarts oder Failovers in meinen DB-Instances von Aurora PostgreSQL-Compatible?

Lesedauer: 3 Minute
0

Ich möchte herausfinden, was dazu geführt hat, dass meine Datenbank (DB)-Instances von Amazon Aurora PostgreSQL-Compatible Edition unerwartet neu gestartet wurden oder ein Failover erfolgte, und zukünftige Vorkommnisse verhindern.

Kurzbeschreibung

Unerwartete Neustarts in DB-Instances von Aurora PostgreSQL-Compatible können aufgrund von Hardwarefehlern, hoher Ressourcenauslastung, Replikationsverzögerungen oder Softwareproblemen auftreten.

Lösung

Überprüfen von Amazon-RDS-Ereignissen für die DB-Instance

Gehe wie folgt vor:

  1. Öffne die Amazon Relational Database Service (Amazon RDS)-Konsole.
  2. Wähle im Navigationsbereich Ereignisse aus.
  3. Suche nach Ereignissen, die ungefähr zu der Zeit eingetreten sind, als die DB-Instance neu gestartet wurde.

Weitere Informationen findest du unter Amazon-RDS-Ereignisse anzeigen und Mit Amazon-RDS-Ereignisbenachrichtigungen arbeiten.

Analysieren von DB-Instance-Metriken

Gehe wie folgt vor:

  1. Öffne die Amazon-RDS-Konsole.
  2. Wähle im Navigationsbereich Datenbanken.
  3. Wähle die DB-Instance aus.
  4. Wähle die Registerkarte Überwachung aus.
  5. Überprüfe die folgenden Metriken:<br id=hardline_break/> Suche bei CPUUtilization nach einer anhaltend hohen CPU-Auslastung.<br id=hardline_break/> Stelle für DatabaseConnections sicher, dass die Anzahl der Verbindungen das Kontingent nicht überschreitet.<br id=hardline_break/> Vergewissere dich bei FreeableMemory, dass ausreichend Speicher verfügbar ist.<br id=hardline_break/> Suche bei ReadIOPS und WriteIOPS nach ungewöhnlichen E/A-Mustern.<br id=hardline_break/> (Nur Reader-Instances) Überprüfe für AuroraReplicaLag die Replikations-Verzögerungswerte.
  6. Halte Ausschau nach Anomalien oder Spitzen, die den Neustart ausgelöst haben könnten.

Weitere Informationen findest du unter Amazon-Aurora-Metriken mit Amazon CloudWatch überwachen.

Prüfen von CloudWatch Database Insights

Gehe wie folgt vor:

  1. Öffne die Amazon-RDS-Konsole.
  2. Wähle im Navigationsbereich Database Insights aus.
  3. Wähle im Bereich Database Insights deine DB-Instance aus der Liste aus.
  4. Analysiere die wichtigsten SQL-Abfragen und Warteereignisse rund um den Zeitpunkt des Neustarts.

Weitere Informationen findest du unter Überwachen von Amazon-Aurora-Datenbanken mit CloudWatch Database Insights.

Nach Hardwareproblemen suchen

Wenn du einen Hardwarefehler vermutest, wende dich an den AWS Support, um das Problem zu beheben. Der AWS Support kann überprüfen, ob ein Problem auf Host-Ebene den Neustart ausgelöst hat.

DB-Protokolle überprüfen

Gehe wie folgt vor:

  1. Öffne die Amazon-RDS-Konsole.
  2. Wähle im Navigationsbereich Datenbanken.
  3. Wähle die DB-Instance aus.
  4. Wähle die Registerkarte Logs & events (Protokolle und Ereignisse) aus.
  5. Lade im Abschnitt Protokolle die PostgreSQL-Protokolldateien herunter und überprüfe sie auf Fehler oder Warnungen zum Zeitpunkt des Neustarts.

Weitere Informationen zu Aurora-PostgreSQL-Datenbank-Protokolldateien findest du unter Aurora-PostgreSQL-Datenbank-Protokolldateien.

Nach ausstehenden Wartungen suchen

Gehe wie folgt vor:

  1. Öffne die Amazon-RDS-Konsole.
  2. Wähle im Navigationsbereich Datenbanken.
  3. Wähle die DB-Instance aus.
  4. Wähle die Registerkarte Wartung und Backups aus.
  5. Wenn Wartungen ausstehen, wähle Jetzt anwenden oder Im nächsten Wartungsfenster übernehmen.

Erstellen eines Alarms

Richte CloudWatch-Alarme für wichtige Metriken wie CPU-Auslastung, Speichernutzung und Replikationsverzögerung ein.

Optimieren der Ressourcenauslastung

Ergreife die folgenden Maßnahmen:

Skalieren der Ressourcen

Wenn du ständig eine hohe Ressourcenauslastung feststellst, skaliere den Instance-Typ hoch oder füge Aurora-Replikate hinzu.

Die Datenbank auf dem neuesten Stand halten

Wende regelmäßig Patches und Versionsupgrades an, um Fehler zu beheben und die Leistung zu verbessern.

Implementieren der Hochverfügbarkeit

Verwende für eine einzelne Instance Multi-AZ-DB-Instance-Bereitstellungen. Stelle bei Aurora-Clustern sicher, dass du über mindestens eine Reader-Instance verfügst, die Aurora bei Problemen mit der Writer-Instance bewerben kann.

Weitere Informationen findest du unter Hochverfügbarkeit für Amazon Aurora.

Ähnliche Informationen

Überwachungstools für Amazon Aurora

Wie behebe ich Probleme, die dazu führen, dass meine Aurora-Read-Replica verzögert und neu gestartet wird?

Schnelles Failover mit Amazon Aurora PostgreSQL

AWS OFFICIALAktualisiert vor 5 Monaten