¿Cómo puedo resolver problemas comunes que provocan que mi instancia de Lightsail no responda?

6 minutos de lectura
0

Mi instancia de Amazon Lightsail no responde. ¿Cuáles son algunos motivos comunes y cómo puedo solucionarlos?

Descripción corta

Si su instancia no responde, verifique las métricas de la instancia de las comprobaciones de estado para determinar los pasos de solución de problemas. Amazon Lightsail monitorea el estado de cada instancia mediante dos comprobaciones de estado:

Comprobación de estado del sistema: la comprobación de estado del sistema detecta problemas con el host subyacente en el que se ejecuta la instancia. Si el host subyacente no responde o no se puede acceder a él debido a problemas de red, hardware o software, se produce un error en la comprobación de estado.

Comprobación de estado de la instancia: un error en la comprobación de estado de la instancia indica un problema con la instancia debido a errores en el nivel del sistema operativo. Los errores en el nivel del sistema operativo son los siguientes:

  • Error al arrancar el sistema operativo.
  • Error al montar los volúmenes correctamente.
  • Problemas del sistema de archivos.
  • Controladores incompatibles.
  • Pánico en el núcleo.

Las comprobaciones de estado de las instancias también pueden fallar debido a la sobreutilización de los recursos. A continuación, exponemos los tres motivos más comunes por los que la comprobación de estado podría fallar debido a la sobreutilización de los recursos:

  • Es posible que su instancia funcione en la zona de ráfagas cuando está sometida a una carga pesada. Esto puede hacer que la instancia no responda o que la instancia se bloquee.
  • El dispositivo raíz está lleno al 100 % y la instancia se bloqueó durante el arranque.
  • Los procesos que se ejecutan en la instancia utilizan toda su memoria, lo que impide que el núcleo se ejecute.

Resolución

Consulte las métricas de comprobación de estado de su instancia para determinar si la instancia no superó la comprobación de estado del sistema o la comprobación de estado de la instancia.

Error de comprobación de estado del sistema

Si se produce un error en la comprobación de estado del sistema, la instancia debe migrarse a un nuevo host en buen estado mediante la detención e inicio de la instancia. Puede detener e iniciar manualmente la instancia para migrarla a un nuevo host en buen estado.

Nota: Detener e iniciar no equivale a reiniciar. El proceso de iniciar es necesario para migrar la instancia a un hardware en buen estado.

Advertencia: Antes de detener e iniciar su instancia, tenga en cuenta que la dirección IP pública de la instancia cambia cada vez que se detiene y se inicia la instancia. Si quiere una IP pública que no cambie en cada detención e inicio de la instancia, puede adjuntar una dirección IP estática.

Error de comprobación de estado de instancia

Si se produce un error en la comprobación de estado de la instancia, puede deberse a problemas a nivel del sistema operativo que provocan errores de arranque o una utilización excesiva de los recursos de la instancia. Los siguientes son los motivos habituales de un error en la comprobación de estado de la instancia:

Uso elevado de la CPU

Consulta la métrica CPUUtilization de la instancia. Observe si la utilización de la CPU está por encima de la zona sostenible, lo que significa que su instancia funciona en la zona de ráfagas y está sometida a una carga pesada. Si este es el caso, utilice las siguientes opciones para solucionar el problema:

  • Reinicie su instancia para que vuelva a su estado correcto.
    Nota: Si los requisitos de CPU de la instancia son superiores a los que puede ofrecer el plan de instancias actual, el problema volverá a producirse después de reiniciar.
  • Considere cambiar a un plan de instancias mayor que satisfaga sus requisitos de CPU.

Memoria agotada

Cuando se agota la memoria, el núcleo no tiene memoria suficiente para ejecutarse. Cuando esto ocurre, otros procesos se detienen para liberar memoria, lo que hace que la instancia no responda. Puede intentar reiniciar la instancia o detener e iniciarla. Estos procedimientos reducen el uso de memoria.

Errores de disco completo

Si no queda espacio en el dispositivo y el sistema de archivos ha alcanzado su capacidad, es posible que la instancia haya entrado en modo de emergencia porque el dispositivo raíz está lleno. Para resolver este problema, puede aumentar su plan o paquete de Lightsail a uno con un volumen de mayor tamaño.

Para actualizar su plan de Lightsail a una instancia de mayor tamaño, haga lo siguiente:

1.    Genere una instantánea de su instancia.

2.    Cree una instancia de mayor tamaño a partir de la instantánea.

3.    Tras actualizar su plan de Lightsail, conéctese a su instancia.

4.    Ejecute el comando lsblk para comprobar la estructura del disco. Aunque el espacio en disco aumente, es posible que no haya suficiente espacio libre y se evite la ejecución del proceso automático que aumenta la partición y el sistema de archivos. Si esto ocurre, libere espacio y aumente manualmente la partición seguido del sistema de archivos. Para hacerlo, ejecute los siguientes comandos:

Ejecute el comando growpart para aumentar el tamaño de la partición raíz o partición 1:

$ sudo growpart /dev/xvda 1

Ejecute el comando lsblk para comprobar que la partición 1 se ha ampliado:

$ lsblk

Amplíe el sistema de archivos. Compruebe el sistema de archivos de la partición raíz “/” mediante el siguiente comando:

$ lsblk -f

En el siguiente ejemplo se amplía un sistema de archivos EXT2/EXT3/EXT4 de la partición 1:

$ sudo resize2fs /dev/xvda1

En el siguiente ejemplo, se amplía un sistema de archivos de tipo XFS. En este ejemplo, “/” es el punto de montaje del volumen.

$ sudo xfs_growfs -d /

Después de ampliar el sistema de archivos, ejecute el comando df -h para comprobar que el sistema operativo puede ver el espacio adicional:

$ df -h

Otros problemas a nivel del SO

Otros problemas incluyen problemas de arranque, pánico en el núcleo y errores de red. Además, puede haber errores en dispositivos de bloques, errores de software, tareas bloqueadas o problemas inusuales del sistema. Todo esto puede dar lugar a que la instancia no responda. Intente reiniciar o detener e iniciar la instancia. Si el reinicio o la detención y el inicio no resuelven el problema, es posible que deba migrar el servidor Lightsail a EC2 para solucionar el problema. Esto se debe a que las opciones de solución de problemas son limitadas en Lightsail, al igual que para cargas de trabajo más sencillas.


Información relacionada

Creación de instancias de Amazon EC2 a partir de instantáneas exportadas en Lightsail

OFICIAL DE AWS
OFICIAL DE AWSActualizada hace 3 años