Wie kann ich ein Failover in meiner Aurora Global Database durchführen und warum schlug mein Failover fehl?

Lesedauer: 4 Minute
0

Ich möchte wissen, wie ein Failover in meiner globalen Datenbank mit Amazon Aurora PostgreSQL-Compatible Edition durchgeführt wird und weshalb ein Failover fehlgeschlagen ist.

Lösung

Für eine Aurora Global Database gibt es zur Durchführung eines Failovers zwei verschiedene Optionen:

  • Manuelles ungeplantes Failover („Trennen und hochstufen“) – Verwenden Sie diese Option für die Wiederherstellung nach einem ungeplanten Ausfall oder zum Durchführen von Tests zur Notfallwiederherstellung.
  • Verwaltetes geplantes Failover – Nutzen Sie diese Option für die betriebliche Wartung oder andere geplante Betriebsabläufe.

Manuelles ungeplantes Failover

Gehen Sie zunächst wie folgt vor, um nach einem ungeplanten Ausfall in der primären AWS-Region ein Failover auf einen sekundären Cluster durchzuführen:

  1. Stoppen Sie die Ausgabe von DML-Anweisungen und anderen Schreibvorgängen an den primären Aurora-DB-Cluster in der AWS-Region mit dem Ausfall.
  2. Ermitteln Sie einen Aurora-DB-Cluster aus einer sekundären AWS-Region, der als neuer primärer DB-Cluster verwendet werden soll. Wenn Sie zwei oder mehr sekundäre AWS-Regionen in Ihrer Aurora Global Database haben, wählen Sie den sekundären Cluster mit der geringsten Verzögerung aus.
  3. Entfernen Sie den ausgewählten sekundären DB-Cluster aus der Aurora Global Database.

Gehen Sie dann wie folgt vor, um das manuelle ungeplante Failover abzuschließen:

  1. Konfigurieren Sie Ihre Anwendung neu, um alle Schreibvorgänge über den neuen Endpunkt an den jetzt eigenständigen Aurora-DB-Cluster zu senden. Wenn Sie die angegebenen Namen beim Erstellen der Aurora Global Database akzeptiert haben, ändern Sie den Endpunkt, indem Sie das -ro aus der Endpunktzeichenfolge des Clusters entfernen.
    Beispielsweise wird der Endpunkt des sekundären Clusters my-global.cluster-ro-aabb.us-west-1.rds.amazonaws.com zu my-global.cluster-aabb.us-west-1.rds.amazonaws.com, wenn dieser Cluster von der Aurora Global Database getrennt wird.
    Der sekundäre Aurora-DB-Cluster wird zum primären Cluster einer neuen Aurora Global Database, wenn Sie ihm Regionen hinzuzufügen.
  2. Fügen Sie zum DB-Cluster eine AWS-Region hinzu, um die Replikation vom primären auf den sekundären Cluster zu starten.
  3. Fügen Sie nach Bedarf weitere AWS-Regionen hinzu, um die nötige Topologie zur Unterstützung Ihrer Anwendung wiederherzustellen.

Weitere Informationen finden Sie unter Wiederherstellen einer Amazon Aurora Global Database nach einem ungeplanten Ausfall.

Verwaltetes geplantes Failover

Gehen Sie wie folgt vor, um ein verwaltetes geplantes Failover für Ihre Aurora Global Database zu starten:

  1. Öffnen Sie die Amazon-RDS-Konsole.
  2. Wählen Sie Datenbanken aus und suchen Sie die Aurora Global Database, für die Sie ein Failover durchführen möchten.
  3. Wählen Sie im Menü „Aktionen“ die OptionFailover Global Database aus. Das Failover ist jetzt ausstehend und startet erst nach der Auswahl des Failover-Ziels.
  4. Wählen Sie den sekundären Aurora-DB-Cluster aus, den Sie zum primären Cluster hochstufen möchten. Der sekundäre DB-Cluster muss verfügbar sein.
    Hinweis: Wenn Sie mehr als einen sekundären DB-Cluster haben, vergleichen Sie die Verzögerung für alle sekundären DB-Cluster. Wählen Sie dann den Cluster mit der geringsten Verzögerung aus.
  5. Wählen Sie Failover Global Database aus, um Ihre Wahl des sekundären DB-Clusters zu bestätigen, und beginnen Sie mit dem Failover-Prozess.
    In der Spalte Status der Datenbankenliste wird der Status jeder Aurora-DB-Instance und jedes Aurora-DB-Clusters während des Failover-Prozesses angezeigt.
    Die Statusleiste oben in der Konsole zeigt den Fortschritt an und hat die Option Failover abbrechen.
    Wenn Sie Failover abbrechen auswählen, haben Sie die Möglichkeit, mit dem Failover fortzufahren oder den Failover-Prozess abzubrechen.
  6. Wählen Sie Schließen aus, um das Failover fortzusetzen, und schließen Sie die Eingabeaufforderung.

Nach Abschluss des Failovers sehen Sie die Aurora-DB-Cluster und ihren aktuellen Status in der Datenbankenliste. Weitere Informationen finden Sie unter Durchführen von verwalteten geplanten Failovers für Amazon Aurora Global Databases.

Sie können auch die AWS Command Line Interface (AWS CLI) verwenden, um einen verwalteten geplanten Failover anzustoßen, indem Sie den Befehl failover-global-cluster ausführen.

Gründe für das Fehlschlagen des Failovers

Ein Failover kann aus einem der folgenden Gründe fehlschlagen:

  • Verzögerung der Replikation zwischen Quelle und Ziel
  • Ausfälle der Availability Zone
  • Ausfälle von Rechenknoten
  • Netzwerkprobleme zwischen DB-Instances
  • Speicherprobleme
  • Umfangreiche Aufgaben

Ähnliche Informationen

Verwenden von Failover in einer Amazon Aurora Global Database

AWS OFFICIAL
AWS OFFICIALAktualisiert vor einem Jahr