¿Cómo puedo solucionar un error del nodo principal con el mensaje “502 Bad Gateway” (502 Puerta de enlace no válida) o “504 Gateway Time-out” (504 Tiempo de espera de puerta de enlace agotado) en Amazon EMR?

4 minutos de lectura
0

Mi nodo principal de Amazon EMR está fallando y aparece el error “502 Bad Gateway” (502 Puerta de enlace no válida) o “504 Gateway Time-out” (504 Tiempo de espera de puerta de enlace agotado).

Descripción breve

Es posible que un nodo principal de EMR muestre uno de los siguientes errores:

The master failed: Error occurred:<html>?? <head><title>502 Bad Gateway</title></head> <body>?? <center><h1>502 Bad Gateway</h1></center> <hr><center>nginx/1.20.0</center>?? </body>?? </html>??

o bien

The master failed: Error occurred: <html>??<head><title>504 Gateway Time-out</title></head>??<body>??<center><h1>504 Gateway Time-out</h1></center>??<hr><center>nginx/1.16.1</center>??</body>??</html>??

A continuación se explican los motivos comunes de estos errores:

  • El daemon del controlador de instancias está detenido o inactivo en la instancia del nodo principal.
  • El nodo principal se queda sin memoria o espacio en disco.
  • Las comprobaciones de estado de las instancias de Amazon Elastic Compute Cloud (Amazon EC2) fallan.

Resolución

Solucionar errores del daemon del controlador de instancias del nodo principal

El controlador de instancias (I/C) del nodo principal es el daemon que se comunica con el plano de control de EMR y el resto del clúster. Si el controlador de instancias no puede comunicarse con el plano de control de EMR, el nodo principal se clasifica como en mal estado y el clúster se termina.

Para resolver este problema, analice los registros del controlador de instancias para determinar por qué falló el proceso. Los registros del controlador de instancias se encuentran en /emr/instance-controller/log/.

Si la protección de terminación está activada, acceda mediante SSH al nodo principal y reinicie el proceso del controlador de instancias.

En Amazon EMR 5.30.0 y versiones posteriores:

1.    Utilice el siguiente comando para comprobar el estado del controlador de instancias:

sudo systemctl status instance-controller.service

2.    Utilice el siguiente comando para reiniciar el controlador de instancias si se encuentra en estado inactivo:

sudo systemctl start instance-controller.service

En las versiones 4.x-2.x de Amazon EMR:

1.    Utilice el siguiente comando para comprobar el estado del controlador de instancias:

sudo /etc/init.d/instance-controller status

2.    Utilice el siguiente comando para reiniciar el controlador de instancias si se encuentra en estado inactivo:

sudo /etc/init.d/instance-controller start

Analizar los archivos de registro para solucionar problemas de memoria y disco

  1. Si la protección de terminación está activada, utilice SSH para conectarse al nodo principal. A continuación, revise el archivo de registro del estado de la instancia.
  2. Analice las métricas de la instancia, como la memoria y el disco, que figuran en el registro de estado de la instancia. Puede analizar estas métricas mediante comandos de Linux como free -m y df -h.
  3. Utilice los resultados del archivo de registro para determinar por qué el nodo principal utiliza mucha cantidad de disco o memoria.

Solucionar errores de comprobación del estado de la instancia de EC2 del nodo principal

Solucionar los problemas de los nodos principales que tengan desactivada la protección de terminación cuando el clúster ya esté terminado


OFICIAL DE AWS
OFICIAL DE AWSActualizada hace un año