Get Hands-on with Amazon EKS - Workshop Event Series
Whether you're taking your first steps with Kubernetes or you're an experienced practitioner looking to sharpen your skills, our Amazon EKS workshop series delivers practical, real-world experience that moves you forward. Learn directly from AWS solutions architects and EKS specialists through hands-on sessions designed to build your confidence with Kubernetes. Register now and start building with Amazon EKS!
¿Cómo soluciono los errores de comprobación de estado de mi instancia de EC2 de Linux?
Mi instancia de Linux de Amazon Elastic Compute Cloud (Amazon EC2) no es accesible y no supera sus comprobaciones de estado.
Descripción corta
Amazon EC2 utiliza tres comprobaciones de estado para supervisar el estado de las instancias de EC2.
Comprobación del estado del sistema
La comprobación de estado del sistema detecta problemas con el hardware subyacente de una instancia. Si el hardware subyacente no responde o es inaccesible debido a problemas de red, hardware o software, entonces la comprobación de estado del sistema da error.
Comprobación del estado de la instancia
La comprobación del estado de la instancia falla cuando no puedes acceder a ella. Las comprobaciones del estado de las instancias pueden fallar por los siguientes motivos:
- El sistema operativo (SO) no arranca
- Los volúmenes de Amazon Elastic Block Store (Amazon EBS) no se montan correctamente
- La CPU y la memoria están agotadas
- Pánico en el núcleo
- Error de red
- Limitación de los parámetros de volumen raíz de EBS
Comprobaciones de estado de EBS adjuntas
Las comprobaciones de estado de EBS adjuntas supervisan si los volúmenes de EBS adjuntos a una instancia son accesibles y pueden completar las operaciones de E/S. Para obtener más información, consulta Comprobaciones de estado de EBS adjuntas.
Resolución
Para ver si la comprobación de estado de la instancia o del sistema han dado error, consulta las métricas de comprobación de estado de la instancia.
Si la comprobación de estado del sistema ha dado error, consulta ¿Por qué mi instancia de EC2 de Linux no supera la comprobación de estado del sistema?
Si la comprobación de estado de la instancia ha dado error, comprueba los registros del sistema de la instancia para ver la causa del error. A continuación, elige una de las siguientes opciones de resolución para resolver el problema.
Importante: Algunas de las siguientes resoluciones requieren que detengas y, a continuación, inicies una instancia. Los datos del volumen de un almacén de instancias se pierden cuando detienes la instancia. Si tu instancia no tiene volúmenes respaldados por EBS, haz una copia de seguridad de tus datos antes de detener la instancia. Además, la dirección IPv4 pública de la instancia puede cambiar después de detener e iniciar la instancia. Para retener la misma dirección IPv4 pública, utiliza una dirección IP elástica. Para obtener más información, consulta Detención e inicio de una instancia de Amazon EC2.
El sistema operativo no arranca
Si los registros del sistema contienen errores de arranque, consulta Mi instancia de EC2 de Linux no pasó la comprobación del estado de la instancia debido a problemas con el sistema operativo. ¿Cómo puedo solucionar este problema?
Los volúmenes de EBS no se montan correctamente
Un fallo en el punto de montaje podría provocar que la instancia no supere la comprobación de estado.
Ejemplo de fallo en el punto de montaje:
[FAILED] Failed to mount / See 'systemctl status mnt-nvme0n1p1.mount' for details. [DEPEND] Dependency failed for Local File Systems.
Para más información sobre estos errores, consulta ¿Por qué mi instancia de Linux de EC2 pasa al modo de emergencia cuando intento iniciarla? Consulta también Mi instancia de EC2 de Linux no pasó la comprobación de estado de la instancia debido a problemas con el sistema operativo. ¿Cómo puedo solucionar este problema?
Cuando cambias un tipo de instancia Xen a una instancia basada en Nitro, el montaje del volumen podría fallar. El error de montaje se produce porque los volúmenes de EBS se exponen como dispositivos de bloques NVMe en instancias basadas en Nitro. Por ejemplo, los nombres de los dispositivos son /dev/nvme0n1 y /dev/nvme1n1. Los nombres de dispositivos que se hayan especificado en una asignación de dispositivos de bloques se cambian a nombres de dispositivos NVMe. Por ejemplo, /dev/nvme[0-26]n1.
Nota: El controlador de dispositivos de bloques puede asignar los nombres de los dispositivos NVMe en un orden diferente al orden que hayas especificado en la asignación de dispositivos de bloques. Para evitar errores de montaje en las instancias basadas en Nitro, se recomienda utilizar una etiqueta o un UUID para los nombres de los dispositivos. Para obtener más información, consulta Hacer que un volumen de Amazon EBS esté disponible para su uso.
La CPU y la memoria están agotadas
Uso alto de la CPU
Si la métrica CPUUtilization es igual o cercana al 100 %, la instancia no tiene suficiente capacidad de procesamiento para ejecutar el núcleo.
En el caso de las instancias T2 o T3, revisa las métricas de crédito de CPU de Amazon CloudWatch para ver si los créditos de CPU son iguales o cercanos a cero. Si los créditos de CPU están en cero, la métrica CPUUtilization muestra un nivel de saturación en el rendimiento de referencia de la instancia. Por ejemplo, el rendimiento de referencia puede ser del 20 o el 40 %. Si el uso de la CPU es igual o cercano al 100 %, o las instancias T2 o T3 han alcanzado un nivel de saturación, se indica que no se ha superado la comprobación de estado debido a una sobreutilización de recursos.
Para solucionar este problema, consulta ¿Cómo soluciono los problemas de una instancia de EC2 de Linux que no supera una comprobación de estado debido al uso excesivo de los recursos?
Los fallos en dispositivos de bloques, los errores de software o el pánico en el núcleo pueden provocar un pico inusual en el uso de la CPU. Si el uso de la CPU es del 100 %, comprueba los registros del sistema para ver si hay fallos de dispositivos de bloques o problemas en la memoria u otros errores inusuales del sistema. A continuación, reinicia o detén e inicia la instancia.
Sin memoria
La alta presión de memoria puede provocar un error en la comprobación de estado de la instancia. En el siguiente ejemplo de extracción de registro, el sistema operativo se queda sin memoria y se inicia el OOM-killer. Para resolver este error, detén el proceso que consume más memoria.
[115879.769795] Out of memory: kill process 20273 (httpd) score 1285879 or a child [115879.769795] Killed process 1917 (php-cgi) vsz:467184kB, anon-rss:101196kB, file-rss:204kB
De forma predeterminada, las métricas de memoria y disco de la instancia de EC2 no se envían a CloudWatch. Para obtener más información, consulta Recopilación de métricas, registros y seguimientos con el agente de CloudWatch.
Para resolver el problema de falta de memoria, actualiza la instancia a un tipo de instancia más grande. O bien, agrega almacenamiento de intercambio a la instancia para aliviar la presión de memoria. Para obtener más información, consulta ¿Cómo asigno memoria para que funcione como un archivo de intercambio en una instancia de Amazon EC2? Consulta también ¿Cómo puedo asignar memoria para que funcione como espacio de intercambio en una instancia de Amazon EC2 mediante una partición de mi disco duro?
Errores de disco lleno
Si los registros del sistema contienen errores de disco lleno, la instancia está en modo de emergencia porque el dispositivo raíz está lleno.
Ejemplo de registro del sistema:
$: sudo service apache2 restart Error: No space left on device $: sudo /etc/init.d/mysql restart [....] Restarting mysql (via systemctl): mysql.serviceError: No space left on device $: df -h / Filesystem Size Used Avail Use% Mounted on /dev/root 7.7G 7.7G 0 100% /
Para obtener más información, consulta ¿Cómo soluciono los problemas de una instancia de EC2 de Linux que no supera una comprobación de estado debido al uso excesivo de los recursos? Consulta también ¿Cómo puedo aumentar el tamaño de mi volumen de EBS si recibo un mensaje de error que indica que no queda espacio en mi sistema de archivos?
Pánico en el núcleo
El pánico en el núcleo se produce cuando el núcleo detecta un error interno grave durante la operación. Si el kernel no se carga correctamente, el error se produce durante el arranque del sistema operativo. Un error de carga del kernel provoca un error en el arranque de la instancia.
Ejemplo de salida de error de pánico en el núcleo:
Linux version 2.6.16-xenU (builder@xenbat.amazonsa) (gcc version 4.0.1 20050727 (Red Hat4.0.1-5)) #1 SMP Mon May 28 03:41:49 SAST 2007 Kernel command line: root=/dev/sda1 ro 4 Registering block device major 8 Kernel panic - not syncing: VFS: Unable to mount root fs on unknown-block(8,1)
Para obtener más información, consulta ¿Cómo puedo resolver el error «Kernel panic - not syncing» en mi instancia de EC2? Consulta también ¿Cómo vuelvo a un kernel estable conocido después de que una actualización bloquee el reinicio de mi instancia EC2?
Error de red
La red puede fallar por los siguientes motivos:
- El paquete cloud-init no está instalado en la instancia.
- El paquete cloud-init se usa para actualizar las configuraciones de red en el momento del inicio.
Para corregir este error e instalar el paquete cloud-init en tu instancia, ejecuta los siguientes comandos en tu terminal.
Amazon, Amazon Linux 2, Amazon Linux 2023 o RedHat OS:
sudo yum install cloud-init -y
Ubuntu o sistema operativo Debian:
sudo apt install cloud-init -y
La dirección MAC está codificada de forma fija en un archivo de configuración
Las direcciones MAC codificadas se encuentran en los archivos de configuración de Linux y en los archivos de configuración udev. Puede encontrar estos archivos en las siguientes ubicaciones:
- /etc/udev/rules.d/
- /etc/udev/rules.d/70-persistent-net.rules
- /etc/udev/rules.d/80-net-name-slot.rules
Para resolver los problemas de red causados por una dirección MAC codificada, elimina las entradas o los archivos de configuración y, a continuación, ejecuta el siguiente comando:
sudo mv /etc/udev/rules.d/70-persistent-net.rules /root/
Después de mover el archivo de configuración, reinicia el servicio de red para asegurarte de recibir una nueva dirección MAC.
La dirección IP está codificada de forma fija en un archivo de configuración de red
Al crear una imagen de máquina de Amazon (AMI) a partir de una instancia con una dirección IP configurada de forma estática, el archivo de configuración contiene una dirección IP codificada de forma fija. Para corregir este error, configura la interfaz de red para que utilice DHCP.
Nota: No puedes actualizar las AMI que ya existen. Debes configurar la interfaz de red para que utilice DHCP antes de crear una nueva AMI.
Faltan los controladores de red ENA o mejorados por Intel
Para obtener más información sobre los adaptadores Elastic Network Adapter (ENA) o los controladores de red mejorados por Intel que faltan, consulta Redes mejoradas en instancias de Amazon EC2.
El nombre de la interfaz de red se cambia automáticamente al inicio
Para desactivar el cambio de nombre predecible de la interfaz de red, añade net.ifnames=0 a la línea de comandos del núcleo. Para usar el marcador de posición, debes activar las redes mejoradas con ENA y reconstruir o actualizar el archivo de configuración de grub.
Limitación de los parámetros de volumen raíz de EBS
Cuando se limitan los parámetros del volumen raíz de EBS, es posible que la instancia no supere las comprobaciones de estado porque deja de estar accesible y no responde.
La limitación puede producirse cuando las operaciones de E/S por segundo (IOPS) o el rendimiento de un volumen de EBS superan los límites ya aprovisionados. Es posible que la instancia deje de responder o no se pueda acceder a ella debido a la degradación del rendimiento provocada por la limitación del volumen de EBS.
Para resolver los problemas de limitación de volumen de EBS, sigue estos pasos:
- Supervisa y analiza las métricas de CloudWatch, como la longitud de las colas de volumen, las operaciones de lectura/escritura del volumen y los bytes de lectura/escritura del volumen. Para obtener más información, consulta ¿Cómo puedo usar las métricas de CloudWatch para calcular el rendimiento promedio y el número promedio de IOPS que proporciona mi volumen de EBS?
- Detén e inicia la instancia, o reiníciala, para resolver el problema de forma temporal.
- Aprovisiona más IOPS o rendimiento del volumen de EBS. O bien, actualiza a un volumen de EBS del tipo y tamaño que mejor se adapte a tu carga de trabajo. Para obtener más información, consulta Solicitud de modificaciones de volúmenes de Amazon EBS.
Información relacionada
- Temas
- Compute
- Etiquetas
- LinuxAmazon EC2
- Idioma
- Español
Vídeos relacionados


Contenido relevante
- preguntada hace 3 meses
- preguntada hace 10 meses
- preguntada hace 3 meses
- preguntada hace 6 meses
- preguntada hace 3 meses