Quiero entender por qué se produce un tiempo de inactividad en mis clústeres de bases de datos de Amazon Aurora.
Resolución
Los siguientes motivos pueden provocar un tiempo de inactividad en la instancia de base de datos de Aurora.
Actualizaciones de la versión del motor
Las actualizaciones principales y secundarias provocan un tiempo de inactividad en todo el clúster de la base de datos de Aurora. Antes de actualizar un clúster de base de datos de producción, prueba el proceso de actualización en un clúster de base de datos de prueba. Comprueba la duración del proceso y, a continuación, valida las aplicaciones antes de llevar a cabo la actualización.
También puede usar despliegues azul/verde de Aurora para actualizar la versión principal o secundaria de tu clúster. Cuando se utiliza un despliegue azul/verde, el tiempo de inactividad suele durar menos de 1 minuto.
Actualizaciones automáticas de versiones secundarias
Las actualizaciones automáticas de versiones secundarias provocan tiempo de inactividad en todo el clúster de la base de datos de Aurora. Aurora aplica actualizaciones de versión secundarias durante el periodo de mantenimiento del clúster. Si no deseas que Aurora aplique automáticamente actualizaciones de versiones secundarias, desactiva la opción en tus instancias de base de datos.
Para obtener más información, consulta Actualización de la versión secundaria o el nivel de parche de un clúster de bases de datos de Aurora MySQL.
Nota: El tiempo de inactividad no se produce cuando se activan las actualizaciones automáticas de versiones secundarias. El tiempo de inactividad se produce solo cuando Aurora aplica la actualización automática.
Eventos de conmutación por error del clúster de bases de datos de Aurora
Si tu clúster de base de datos tiene réplicas de Aurora, Aurora promueve una réplica en la instancia principal durante los eventos de conmutación por error. Se produce un breve tiempo de inactividad y las operaciones de lectura y escritura fallan con una excepción. El servicio normalmente se restaura en menos de 120 segundos y, a menudo, en menos de 60 segundos.
Para aumentar la disponibilidad del clúster de la base de datos, cree una o más réplicas de Aurora en dos o más zonas de disponibilidad diferentes. Para obtener más información, consulta Tolerancia a errores para un clúster de base de datos de Aurora.
Tareas de mantenimiento del clúster de bases de datos de Aurora
Algunas tareas de mantenimiento, como las actualizaciones del sistema operativo o la aplicación de parches a la base de datos, hacen que el clúster de la base de datos se desconecte durante un breve periodo de tiempo. Para obtener más información, consulta Mantenimiento de un clúster de base de datos de Amazon Aurora.
Modificaciones del periodo de mantenimiento
El tiempo de inactividad no se produce automáticamente cuando se modifica el periodo de mantenimiento. Es posible que tu clúster de base de datos tenga acciones pendientes. Si modificas el periodo de mantenimiento, aplicas las acciones pendientes inmediatamente y se produce un tiempo de inactividad. Para obtener más información sobre las modificaciones del periodo de mantenimiento, consulta ¿Qué tengo que saber sobre el periodo de mantenimiento de Amazon RDS?
Reinicios de clústeres o instancias de base de datos
El tiempo de inactividad se produce cuando se reinicia un clúster de base de datos o una instancia de base de datos. El tiempo necesario para reiniciar cada instancia de base de datos del clúster depende de la actividad de la base de datos en el momento del reinicio. El tiempo de inactividad también depende del proceso de recuperación del motor de la base de datos.
Modificaciones de la clase de instancia de base de datos
Al modificar la clase de instancia de base de datos, se produce un tiempo de inactividad en la instancia de base de datos concreta, pero no en todo el clúster.
Nuevo grupo de parámetros de clúster de base de datos o asociaciones de grupos de parámetros de base de datos
Al asociar un nuevo grupo de parámetros de clúster de base de datos al clúster de base de datos o un grupo de parámetros de base de datos a la instancia de base de datos, el tiempo de inactividad no se produce automáticamente. El tiempo de inactividad solo se produce cuando debes reiniciar para aplicar los cambios en el grupo de parámetros. Por ejemplo, para aplicar cambios a un grupo de parámetros del clúster de la base de datos, debes reiniciar la instancia de base de datos principal del clúster. Para aplicar los cambios en un grupo de parámetros de base de datos, debes reiniciar la instancia de base de datos.
Ajustes específicos de la instancia o clúster de base de datos
Las siguientes son las modificaciones de configuración más comunes que provocan tiempos de inactividad. Para obtener una lista completa de los ajustes e información sobre si provocan tiempo de inactividad, consulta Configuración de Amazon Aurora.
Modificaciones de la configuración de parámetros en un grupo de parámetros de clúster de base de datos o grupo de parámetros de base de datos
Los parámetros de la base de datos son estáticos o dinámicos. Al modificar la configuración de un parámetro estático en un grupo de parámetros de clúster de base de datos o grupo de parámetros de base de datos, el cambio de parámetro se produce después de reiniciar manualmente las instancias de base de datos de cada clúster de base de datos asociado. El tiempo de inactividad se produce durante el reinicio.
Sin embargo, cuando modificas una configuración de parámetros dinámicos en un grupo de parámetros de clúster de base de datos o grupo de parámetros de base de datos, los cambios se aplican inmediatamente al clúster de base de datos. No hay tiempo de inactividad porque no es necesario reiniciar la instancia de base de datos para modificar los parámetros dinámicos.
Modificaciones del identificador de la instancia de base de datos
Debes reiniciar la instancia de base de datos para modificar el identificador de la instancia de base de datos. El tiempo de inactividad se produce durante este cambio.
Modificaciones del puerto de la base de datos
El tiempo de inactividad se produce cuando modificas el puerto de base de datos que utilizas para acceder al clúster de base de datos, ya que todas las instancias de base de datos del clúster se reinician inmediatamente.
Modificaciones de CA
Nota: Si se muestran errores al ejecutar comandos de la Interfaz de la línea de comandos de AWS (AWS CLI), consulta Solución de problemas de AWS CLI. Además, asegúrate de utilizar la versión más reciente de la AWS CLI.
Si modificas la autoridad de certificación (CA) del certificado de servidor de la instancia de base de datos, se producen tiempos de inactividad en los motores de base de datos que no admiten la rotación sin reiniciar.
Para comprobar si tu motor de base de datos admite la rotación sin reiniciar, ejecuta el comando describe-db-engine-versions de la AWS CLI.
Información relacionada
Performing major version upgrades for Amazon Aurora MySQL with minimum downtime (Realización de actualizaciones principales de la versión para MySQL de Amazon Aurora con un tiempo de inactividad mínimo)