Salta al contenuto

Come posso risolvere i problemi di riavvio o failover imprevisto delle mie istanze database Aurora compatibile con PostgreSQL?

4 minuti di lettura
0

Desidero determinare cosa ha causato il riavvio o il failover imprevisto delle mie istanze database Amazon Aurora compatibile con PostgreSQL ed evitare che il problema si ripeta in futuro.

Breve descrizione

Il riavvio imprevisto di un'istanza database Aurora compatibile con PostgreSQL può verificarsi a causa di guasti hardware, utilizzo elevato delle risorse, ritardo di replica o problemi software.

Risoluzione

Controlla gli eventi di Amazon RDS per l'istanza database

Completa i seguenti passaggi:

  1. Apri la console Amazon Relational Database Service (Amazon RDS).
  2. Nel pannello di navigazione, scegli Eventi.
  3. Cerca gli eventi che si sono verificati nel momento in cui l'istanza database è stata riavviata.

Per ulteriori informazioni, consulta Visualizzazione di eventi Amazon RDS e Utilizzo della notifica degli eventi di Amazon RDS.

Analizza le metriche dell'istanza database

Completa i seguenti passaggi:

  1. Apri la console Amazon RDS.
  2. Nel pannello di navigazione, scegli Database.
  3. Seleziona l'istanza database.
  4. Scegli la scheda Monitoraggio.
  5. Rivedi le seguenti metriche:<br id=hardline_break/> Per CPUUtilization, verifica se l'utilizzo della CPU è elevato e prolungato.<br id=hardline_break/> Per DatabaseConnections, verifica che il numero di connessioni non superi la quota.<br id=hardline_break/> Per FreeableMemory, verifica che sia disponibile memoria sufficiente.<br id=hardline_break/> Per ReadIOPS e WriteIOPS, cerca modelli di I/O insoliti.<br id=hardline_break/> (Solo istanze di lettura) Per AuroraReplicaLag, controlla i valori del ritardo di replica.
  6. Cerca anomalie o picchi che potrebbero aver determinato il riavvio.

Per ulteriori informazioni, consulta Monitoraggio delle metriche di Amazon Aurora con Amazon CloudWatch.

Utilizza CloudWatch Database Insights

Completa i seguenti passaggi:

  1. Apri la console Amazon RDS.
  2. Nel pannello di navigazione, scegli Database Insights.
  3. Nel pannello Database Insights, seleziona l'istanza database dall'elenco.
  4. Analizza le principali query SQL e gli eventi di attesa intorno al momento del riavvio.

Per ulteriori informazioni, consulta Monitoraggio dei database Amazon Aurora con CloudWatch Database Insights.

Verifica la presenza di guasti hardware

Se sospetti un guasto hardware, contatta il Supporto AWS per risolvere il problema. Il Supporto AWS può verificare se il riavvio è stato determinato da un problema a livello di host.

Rivedi i log del database

Completa i seguenti passaggi:

  1. Apri la console Amazon RDS.
  2. Nel pannello di navigazione, scegli Database.
  3. Seleziona l'istanza database.
  4. Scegli la scheda Log ed eventi.
  5. Nella sezione Log, scarica ed esamina i file di log di PostgreSQL per individuare eventuali errori o avvisi al momento del riavvio.

Per ulteriori informazioni sui file di log del database Aurora PostgreSQL, consulta File di log del database Aurora PostgreSQL.

Verifica la presenza di manutenzioni in sospeso

Completa i seguenti passaggi:

  1. Apri la console Amazon RDS.
  2. Nel pannello di navigazione, scegli Database.
  3. Seleziona l'istanza database.
  4. Scegli la scheda Manutenzione e backup.
  5. Se è presente una manutenzione in sospeso, scegli Applica ora o Applica alla finestra di manutenzione successiva.

Crea un allarme

Configura in CloudWatch allarmi per le metriche critiche, come l'utilizzo della CPU, l'utilizzo della memoria e il ritardo di replica.

Ottimizza l'utilizzo delle risorse

Intraprendi le seguenti azioni:

Scala le risorse

Se noti costantemente un utilizzo elevato delle risorse, aumenta verticalmente il tipo di istanza o aggiungi repliche Aurora.

Mantieni aggiornato il database

Per risolvere i bug e migliorare le prestazioni, applica regolarmente patch e aggiornamenti di versione.

Implementa la disponibilità elevata

Per una singola istanza database, utilizza le distribuzioni Multi-AZ. Per i cluster Aurora, assicurati di avere almeno un'istanza di lettura che Aurora possa promuovere in caso di problemi con l'istanza di scrittura.

Per ulteriori informazioni, consulta Elevata disponibilità di Amazon Aurora.

Informazioni correlate

Strumenti di monitoraggio di Amazon Aurora

Come posso risolvere i problemi che causano il ritardo e il riavvio della mia replica di lettura Aurora?

Failover rapido con Amazon Aurora PostgreSQL

AWS UFFICIALEAggiornata 5 mesi fa