Come posso eseguire un failover nel mio database globale Aurora e perché il mio failover non è riuscito?

4 minuti di lettura
0

Voglio sapere come eseguire il failover nel mio database globale Amazon Aurora edizione compatibile con PostgreSQL e perché il failover non è riuscito.

Risoluzione

Esistono due diverse opzioni per eseguire un failover per un database globale Aurora:

  • Failover manuale non pianificato ("distacca e promuovi"): utilizza questa opzione per il ripristino dopo un'interruzione non pianificata o per eseguire test di ripristino di emergenza.
  • Failover pianificato gestito: utilizza questa opzione per la manutenzione operativa o altre procedure operative pianificate.

Failover manuale non pianificato

Per eseguire il failover su un cluster secondario dopo un'interruzione non pianificata nella regione AWS primaria, procedi prima come segue:

  1. Interrompi l'emissione di istruzioni DML e altre operazioni di scrittura sul cluster DB Aurora primario nella Regione AWS dove è avvenuta l'interruzione.
  2. Identifica un cluster DB Aurora da una Regione AWS secondaria da utilizzare come nuovo cluster DB primario. Se hai due o più Regioni AWS secondarie nel tuo database globale Aurora, scegli il cluster secondario con il minor tempo di ritardo.
  3. Rimuovi il cluster DB secondario scelto dal database globale Aurora.

Quindi, per completare il failover manuale non pianificato, procedi come segue:

  1. Riconfigura l'applicazione per inviare tutte le operazioni di scrittura al cluster Aurora DB, ora autonomo, utilizzando il suo nuovo endpoint. Se hai accettato i nomi forniti durante la creazione del database globale Aurora, modifica l'endpoint rimuovendo -ro dalla stringa dell'endpoint del cluster.
    Ad esempio, l'endpoint del cluster secondario my-global.cluster-ro-aabb.us-west-1.rds.amazonaws.com diventa my-global.cluster-aabb.us-west-1.rds.amazonaws.com quando quel cluster viene scollegato dal database globale Aurora.
    Il cluster DB Aurora secondario diventa il cluster primario di un nuovo database globale Aurora quando inizi ad aggiungere Regioni.
  2. Aggiungi una Regione AWS al cluster DB per avviare il processo di replica dal cluster primario a quello secondario.
  3. Aggiungi altre Regioni AWS in base alle esigenze per ricreare la topologia necessaria per supportare la tua applicazione.

Per ulteriori informazioni, consulta Ripristino di un database globale Amazon Aurora da un'interruzione non pianificata.

Failover pianificato gestito

Per avviare un failover pianificato gestito per il database globale Aurora, procedi come segue:

  1. Apri la console di Amazon RDS.
  2. Scegli Databases (database) e trova il database globale Aurora di cui desideri eseguire il failover.
  3. Dal menu Operazioni, seleziona Fail over global database (failover database globale). Il failover è ora in sospeso e il processo inizierà solo dopo aver scelto l'obiettivo del failover.
  4. Scegli il cluster DB Aurora secondario che desideri promuovere a primario. Il cluster DB secondario deve essere disponibile.
    Nota: se possiedi più di un cluster DB secondario, confronta la quantità di ritardo tra tutti i cluster secondari. Quindi scegli quello con il minor ritardo.
  5. Scegli Fail over global database (failover database globale) per confermare la scelta del cluster DB secondario e iniziare il processo di failover.
    La colonna Status (stato) dell'elenco dei database mostra lo stato di ogni istanza DB Aurora e cluster Aurora DB durante il processo di failover.
    La barra di stato nella parte superiore della console mostra lo stato di avanzamento e fornisce l'opzione Cancel failover (annulla failover).
    Se scegli Cancel failover (annulla failover) avrai la possibilità di procedere con il failover o di annullare il processo di failover.
  6. Scegli Close (chiudi) per continuare il failover, ignorando la richiesta.

Una volta completato il failover, è possibile visualizzare i cluster Aurora DB e il loro stato attuale nell'elenco dei database. Per ulteriori informazioni, consulta Esecuzione di failover pianificati gestiti per database globali Amazon Aurora.

Puoi anche utilizzare l'Interfaccia della linea di comando AWS (AWS CLI) per avviare un failover pianificato gestito eseguendo il comando failover-global-cluster.

Motivi del fallimento del failover

Un failover potrebbe fallire per uno dei seguenti motivi:

  • Ritardo di replica tra origine e destinazione
  • Errori della Zona di disponibilità
  • Errori dei nodi di calcolo
  • Problemi di rete tra istanze DB
  • Problemi di archiviazione
  • Eventi su larga scala

Informazioni correlate

Utilizzo del failover in un database globale Amazon Aurora

AWS UFFICIALE
AWS UFFICIALEAggiornata un anno fa