¿Cómo puedo realizar una conmutación por error en mi base de datos global de Aurora y por qué falló mi conmutación por error?

5 minutos de lectura
0

Quiero saber cómo realizar la conmutación por error en mi base de datos global edición compatible con PostgreSQL de Amazon Aurora y conocer los motivos por los que se produjo un error en la conmutación por error.

Resolución

Hay dos opciones diferentes que permiten realizar una conmutación por error en una base de datos global de Aurora:

  • Conmutación por error manual no planificada (“desconectar y promover”): utilice esta opción para recuperarse de una interrupción no planificada o para realizar pruebas de recuperación de desastres.
  • Conmutación por error planificada administrada: utilice esta opción para el mantenimiento operativo u otros procedimientos operativos planificados.

Conmutación por error manual no planificada

Para realizar una conmutación por error a un clúster secundario después de una interrupción no planificada en la región de AWS principal, primero haga lo siguiente:

  1. Deje de emitir declaraciones DML y otras operaciones de escritura en el clúster principal de base de datos Aurora de la región de AWS con la interrupción.
  2. Identifique un clúster de base de datos de Aurora de una región de AWS secundaria para usarlo como un nuevo clúster de base de datos principal. Si tiene dos o más regiones de AWS secundarias en su base de datos global de Aurora, elija el clúster secundario que tenga el menor tiempo de retraso.
  3. Elimine el clúster secundario de base de datos que haya elegido de la base de datos global de Aurora.

Luego, realice lo siguiente para completar la conmutación por error manual no planificada:

  1. Reconfigure la aplicación para enviar todas las operaciones de escritura al clúster de base de datos de Aurora, ahora independiente, mediante su nuevo punto de conexión. Si aceptó los nombres proporcionados al crear la base de datos global de Aurora, cambie el punto de conexión quitando el término -ro de la cadena de puntos de conexión del clúster.
    Por ejemplo, el punto de conexión del clúster secundario my-global.cluster-ro-aabb.us-west-1.rds.amazonaws.com pasará a ser my-global.cluster-aabb.us-west-1.rds.amazonaws.com cuando ese clúster se separe de la base de datos global de Aurora.
    El clúster secundario de base de datos Aurora se convierte en el clúster principal de una nueva base de datos global de Aurora al empezar a agregarle regiones.
  2. Incorpore una región de AWS al clúster de base de datos para iniciar el proceso de replicación del clúster principal al secundario.
  3. Agregue más regiones de AWS según sea necesario para recrear la topología necesaria para dar soporte a su aplicación.

Para obtener más información, consulte Recuperación de una base de datos global de Amazon Aurora de una interrupción no planificada.

Conmutación por error planificada administrada

Para iniciar una conmutación por error planificada y administrada para su base de datos global de Aurora, realice lo siguiente:

  1. Abra la consola de Amazon RDS.
  2. Seleccione Databases (Bases de datos) y busque la base de datos global de Aurora en la que desee realizar la conmutación por error.
  3. En el menú Actions (Acciones), seleccione Fail over global database (Conmutación por error en la base de datos global). La conmutación por error ahora está pendiente, y el proceso no comenzará hasta que haya elegido el destino de la conmutación por error.
  4. Elija el clúster secundario de base de datos de Aurora que desee convertir en principal. El clúster de base de datos secundario debe estar disponible.
    Nota: Si tiene más de un clúster de base de datos secundario, compare el tiempo de retraso de todos ellos. Luego, seleccione el que tenga el menor retraso.
  5. Seleccione Fail over global database (Conmutación por error en la base de datos global) para confirmar su elección del clúster secundario de base de datos e iniciar el proceso de conmutación por error.
    En la columna Status (Estado) de la lista de bases de datos se muestra el estado de cada instancia de base de datos de Aurora y de cada clúster de base de datos de Aurora durante el proceso de conmutación por error.
    La barra de estado de la parte superior de la consola muestra el progreso y ofrece la opción Cancel failover (Cancelar la conmutación por error).
    Si selecciona Cancel failover (Cancelar la conmutación por error), tendrá la opción de continuar con la conmutación por error o de cancelar el proceso de conmutación por error.
  6. Seleccione Close (Cerrar) para continuar con la conmutación por error y omitir el mensaje.

Una vez finalizada la conmutación por error, podrá ver los clústeres de base de datos de Aurora y su estado actual en la lista Databases (Bases de datos). Para obtener más información, consulte Ejecución de la conmutación por error planificada administrada para bases de datos globales de Amazon Aurora.

También puede utilizar la Interfaz de la línea de comandos de AWS (AWS CLI) para iniciar una conmutación por error planificada administrada mediante la ejecución del comando failover-global-cluster.

Motivos de una conmutación por error incorrecta

Es posible que se produzca una falla en la conmutación por error por uno de los siguientes motivos:

  • Retraso en la replicación entre el origen y el destino
  • Fallas en la zona de disponibilidad
  • Fallas en los nodos de cómputos
  • Problemas de creación de redes entre instancias de base de datos
  • Problemas de almacenamiento
  • Eventos a gran escala

Información relacionada

Uso de la conmutación por error en una base de datos global de Amazon Aurora

OFICIAL DE AWS
OFICIAL DE AWSActualizada hace un año