¿Por qué se realizó la conmutación por error en mi clúster compatible con Amazon Aurora PostgreSQL?

5 minutos de lectura
0

Quiero saber qué provocó la conmutación por error de mi clúster de base de datos compatible con Amazon Aurora PostgreSQL.

Descripción breve

El clúster compatible con Aurora PostgreSQL realiza de forma automática la conmutación por error de la instancia en uno de sus lectores de clústeres en los siguientes escenarios:

  • Problema de infraestructura con la instancia de escritor. Esto incluye la pérdida de conectividad de red con el host físico, la pérdida de conectividad de red con el volumen del clúster o los problemas con los recursos físicos de computación.
  • No se puede acceder a la instancia de escritor. Este problema está asociado a una carga de trabajo excesiva, lo que provoca un embotellamiento en el rendimiento y una contención de recursos.
  • El tipo de clase de la instancia de base de datos de escritor cambia como parte de la actividad de escalado vertical de la instancia de base de datos.
  • El host subyacente de la instancia de escritor de Aurora se somete a revisiones de software, mantenimiento de hardware o una actualización del SO durante un periodo de mantenimiento específico. Para obtener más información, consulte Mantenimiento de un clúster de base de datos de Amazon Aurora.
  • Se ha producido una conmutación por error de la instancia mediante la opción de conmutación por error a nivel de instancia.

Cuando el escritor del clúster no responde a las comprobaciones de estado, el clúster inicia una conmutación por error en uno de los lectores del clúster, en función de la prioridad asignada. Para obtener más información, consulte Conmutación por error con Amazon Aurora PostgreSQL.

Resolución

Para identificar el motivo de la conmutación por error, compruebe los siguientes registros y métricas de su clúster compatible con Aurora PostgreSQL.

Eventos de Amazon RDS

Para identificar la causa raíz de una interrupción no planificada, consulte todos los eventos de Amazon Relational Database Service (Amazon RDS) del periodo de conmutación por error. Todos los eventos se registran en la hora UTC/GMT de forma predeterminada. Si desea almacenar eventos durante un periodo de tiempo más largo, envíe los eventos de Amazon RDS a Eventos de Amazon CloudWatch. Para obtener más información, consulte Creación de una regla que se desencadena en un evento de Amazon Aurora.

Métricas de Amazon CloudWatch

Consulte las métricas de Amazon CloudWatch para su clúster compatible con Aurora PostgreSQL a fin de comprobar si la interrupción se debió a una carga elevada de la base de datos. Para obtener más información, consulte Monitoreo de las métricas de Amazon Aurora con Amazon CloudWatch. Compruebe si hay picos en las siguientes métricas clave que indican la disponibilidad y el estado de su instancia/clúster:

  • DatabaseConnections
  • CPUUtilization
  • FreeableMemory
  • DiskQueueDepth

Monitoreo mejorado

A fin de activar el Monitoreo mejorado para las instancias de Amazon Aurora, consulte Configuración y activación de Monitoreo mejorado.

Amazon RDS brinda métricas en tiempo real del SO en el que se ejecuta la instancia de base de datos. Puede ver todas las métricas del sistema y la información de los procesos de sus instancias de PostgreSQL mediante la consola. Puede indicar qué métricas quiere monitorear para cada instancia y luego personalizar el panel según sus requisitos. Para obtener descripciones de las métricas de Monitoreo mejorado, consulte Métricas del SO en Monitoreo mejorado.

Información de rendimiento

Información de rendimiento amplía las características de monitoreo existentes de Amazon Aurora para ilustrar y ayudarlo a analizar el rendimiento de su clúster. Con el panel de Información de rendimiento, puede visualizar la carga de la base de datos en la carga del clúster compatible con Aurora PostgreSQL. Puede filtrar la carga por esperas, instrucciones SQL, hosts o usuarios.

Para obtener más información, consulte Monitoreo de la carga de la base de datos con Información de rendimiento en Amazon Aurora y Análisis de métricas con el panel de Información de rendimiento.

Registros de bases de datos de Aurora

En las bases de datos en las instalaciones, los registros de base de datos residen en el sistema de archivos. Amazon RDS y Amazon Aurora no permiten que el host acceda a los registros de base de datos del sistema de archivos de los clústeres compatibles con Aurora PostgreSQL. Puede utilizar Registros de Amazon CloudWatch para analizar los datos de registro. Para obtener más información, consulte Publicación de registros de Aurora PostgreSQL en Registros de Amazon CloudWatch.

También puede ver un archivo de registro con la Consola de administración de AWS. Para obtener más información, consulte Ver un archivo de registro de base de datos.

Conmutación por error rápida en el clúster compatible con Amazon Aurora PostgreSQL

Para asegurarse de que la conmutación por error se produzca lo más rápido posible en sus clústeres de bases de datos, consulte Conmutación por error rápida con Amazon Aurora PostgreSQL.

Recuperación rápida después de una conmutación por error con administración de caché de clústeres para instancias compatibles con Aurora PostgreSQL

A fin de asegurarse de que la instancia de base de datos de escritor se recupere con rapidez después de una conmutación por error, consulte Recuperación rápida después de una conmutación por error con administración de caché de clústeres para Aurora PostgreSQL.


Información relacionada

Alta disponibilidad para Amazon Aurora

Monitoreo de métricas en un clúster de Amazon Aurora

Categorías y mensajes de eventos de Amazon RDS

OFICIAL DE AWS
OFICIAL DE AWSActualizada hace un año