Complete a 3 Question Survey and Earn a re:Post Badge
Help improve AWS Support Official channel in re:Post and share your experience - complete a quick three-question survey to earn a re:Post badge!
¿Por qué mi grupo de nodos de Amazon EKS está en estado Degradado?
El grupo de nodos administrado de mi clúster de Amazon Elastic Kubernetes Service (Amazon EKS) se encuentra en estado Degradado.
Resolución
Lleva a cabo las siguientes acciones de solución de problemas en función del mensaje de error que recibas en NodeGroupHealth.
AccessDenied
El error AccessDenied se produce cuando Amazon EKS o uno de tus nodos administrados no pueden autenticar o autorizar en tu servidor de API de clúster de Kubernetes. Aparece un error similar al siguiente:
“Your worker nodes do not have access to the cluster. Verify if the node instance role is present and correctly configured in the aws-auth ConfigMap.”
Para solucionar este problema, usa el siguiente comando para confirmar que los permisos del rol de instancia de nodo son correctos en aws-auth configmap:
kubectl get configmap aws-auth -n kube-system -o yaml
O bien, confirma que asignaste correctamente el rol de nodo a una entrada de acceso.
El rol de instancia de nodo de trabajo debe estar presente y correctamente configurado. Asegúrate de asignar el rol de nodo solo a system:bootstrappers o a system:nodes. No se recomienda asignar el rol de nodo al grupo system:masters.
También recibes errores AccessDenied cuando el rol que realiza operaciones en los grupos de nodos administrados no tiene los permisos eks:node-manager ClusterRole o ClusterRoleBinding. Para solucionar este problema, actualiza los permisos de tu rol.
Si utilizas una imagen de máquina de Amazon (AMI) privada de Windows para lanzar un grupo de nodos administrado, es posible que recibas el mensaje de error Not authorized for images. Cuando AWS lanza una nueva AMI de Windows, convierte en privadas todas las AMI con una antigüedad de más de 4 meses. Para solucionar este problema, consulta Not authorized for images.
AmiIdNotFound
El error AmiIdNotFound se produce cuando Amazon EKS no puede encontrar el ID de AMI asociado a la plantilla de lanzamiento. Aparece un error similar al siguiente:
“AmiIdNotFound: The ami id '[ami-0cxx]' does not exist”
Para solucionar este problema, asegúrate de que exista el ID de AMI que agregaste a la plantilla de inicio personalizada. Además, asegúrate de compartirlo con tu cuenta de AWS.
AutoScalingGroupNotFound
El error AutoScalingGroupNotFound se produce cuando Amazon EKS no puede encontrar el grupo de escalamiento automático de Amazon Elastic Compute Cloud (EC2) asociado al grupo de nodos administrado. Aparece un error similar al siguiente:
“AutoScalingGroupNotFound - The Amazon AutoScalingGroup ASG Name was not found.”
Para solucionar este problema, asegúrate de no haber eliminado el grupo de escalamiento automático de EC2 asociado al grupo de nodos administrado. Si has eliminado accidentalmente el grupo de escalamiento automático de EC2, crea un grupo de escalamiento automático de EC2 con el mismo nombre. Espera unos minutos y, a continuación, comprueba si el grupo de nodos vuelve al estado Activo.
ClusterUnreachable
El error ClusterUnreachable se produce cuando Amazon EKS o tus nodos administrados no pueden comunicarse con tu servidor de API de clúster de Kubernetes. Aparece un error similar al siguiente:
“Ec2SecurityGroupNotFound You must use a valid fully-formed launch template. The security group 'sg-09fxx' does not exist in VPC 'vpc-0a8cxx'”
Este error suele producirse debido a interrupciones en la red o a que los servidores de API agotan el tiempo de espera cuando envían las solicitudes. Este error también se produce si superas la cuota de 8 GB para el tamaño de la base de datos etcd. Para solucionar este problema, consulta Administración de kube-proxy en clústeres de Amazon EKS. Además, asegúrate de que los complementos principales, como kube-proxy, CNI de Amazon Virtual Private Cloud (Amazon VPC) y CoreDNS, estén actualizados con la versión más reciente.
AutoScalingGroupInvalidConfiguration
El error AutoScalingGroupInvalidConfiguration se produce cuando configuras incorrectamente el grupo de escalamiento automático de EC2 del grupo de nodos administrado. Aparece un error similar al siguiente:
“AutoScalingGroupInvalidConfiguration: The Amazon AutoScalingGroup ASG Name has subnets ([Incorrect Subnet ID 1, Incorrect Subnet ID 2, Incorrect Subnet ID 3]) which is not expected by Amazon EKS. Expected subnets : ([Correct Subnet ID 1, Correct Subnet ID 2, Correct Subnet ID 3]).”
Para solucionar este problema, identifica y elimina los cambios en el grupo de escalamiento automático de EC2. Asegúrate de que las subredes asociadas no hayan cambiado. Actualiza el grupo de escalamiento automático de EC2 asociado a tu grupo de nodos para usar las subredes que aparecen en el mensaje de error.
No se recomienda actualizar manualmente el grupo de escalamiento automático de EC2 que has asociado al grupo de nodos administrado. Haz un cambio manual únicamente para revertir los cambios manuales que hayas realizado anteriormente.
Ec2SecurityGroupNotFound
El error Ec2SecurityGroupNotFound se produce cuando Amazon EKS no puede encontrar el grupo de seguridad del clúster. Aparece un error similar al siguiente:
“Ec2SecurityGroupNotFound The Amazon EC2 Security Group sg-04f3xx for node group-Name was not found.”
Si recibes este mensaje de error, ya no podrás usar el grupo de nodos administrado en estado Degradado. En su lugar, debes lanzar un nuevo grupo de nodos. A continuación, drena y elimina el grupo de nodos anterior. Para obtener más información sobre cómo drenar un grupo de nodos, consulta Safely drain a node en el sitio web de Kubernetes.
Ec2LaunchTemplateNotFound
El error Ec2LaunchTemplateNotFound se produce cuando la plantilla de lanzamiento de Amazon Elastic Compute Cloud (Amazon EC2) para tu grupo de nodos administrado no coincide con la versión que creó Amazon EKS. Aparece un error similar al siguiente:
“The Amazon EC2 Launch Template lt-0cdac3xxf version number was not found.”
Amazon EKS implementa grupos administrados con una plantilla de lanzamiento administrada que está asociada al grupo de escalamiento automático de EC2 administrado subyacente.
Si eliminaste accidentalmente la plantilla de lanzamiento, se recomienda lanzar un nuevo grupo de nodos. A continuación, drena y elimina el grupo de nodos anterior. Para obtener más información sobre cómo drenar un grupo de nodos, consulta Safely drain a node en el sitio web de Kubernetes.
No se recomienda actualizar manualmente el grupo de escalamiento automático de EC2 que has asociado al grupo de nodos administrado. Haz un cambio manual únicamente para revertir los cambios manuales que hayas realizado anteriormente.
Ec2LaunchTemplateVersionMismatch
El error Ec2LaunchTemplateVersionMismatch se produce cuando la versión de la plantilla de lanzamiento del grupo de escalamiento automático de EC2 del grupo de nodos administrado no coincide con la versión que creó Amazon EKS. Aparece un error similar al siguiente:
“The Amazon EC2 Launch Template : lt-0cdacxx has a new version (number) associated with your Autoscaling group, which is not managed by Amazon EKS. Expected Launch Template version : (number) lt-0cdac39f3axx”
Amazon EKS siempre implementa grupos de nodos administrados con una plantilla de lanzamiento administrada. Si no proporcionas una plantilla de lanzamiento, Amazon EKS creará automáticamente una con los valores predeterminados de tu cuenta. No se recomienda modificar la plantilla generada automáticamente. No es posible actualizar directamente los grupos de nodos existentes que no utilizan una plantilla de lanzamiento personalizada. En su lugar, debes crear un nuevo grupo de nodos con una plantilla de lanzamiento personalizada.
Para resolver el error Ec2LaunchTemplateVersionMismatch de una plantilla de lanzamiento personalizada, actualiza la versión de la plantilla de lanzamiento a la versión esperada de la plantilla de lanzamiento que aparece en el mensaje de error.
Para obtener información sobre las acciones permitidas en una plantilla de lanzamiento para grupos de nodos de Amazon EKS, consulta Conceptos básicos de configuración de plantillas de lanzamiento.
AsgInstanceLaunchFailures
El error AsgInstanceLaunchFailures se produce cuando tu grupo de escalamiento automático de EC2 no puede lanzar instancias. Aparece un error similar al siguiente:
“AsgInstanceLaunchFailures Could not launch Spot Instances. UnfulfillableCapacity - Unable to fulfill capacity due to your request configuration. Please adjust your request and try again. Launching EC2 instance failed.”
Este error suele producirse cuando no hay suficiente capacidad de instancias de spot para el tipo de instancia solicitado. Se recomienda usar una combinación de tipos de instancias y familias de diferentes grupos de instancias de spot para obtener capacidad. Para obtener más información, consulta Cómo puedo lanzar instancias de spot y solucionar problemas mediante grupos de nodos administrados por Amazon EKS?
InsufficientFreeAddresses
El error InsufficientFreeAddresses se produce cuando una subred asociada a tu grupo de nodos administrado no tiene suficientes direcciones IP disponibles para los nodos nuevos. Aparece un error similar al siguiente:
“InsufficientFreeAddresses - Amazon AutoScaling was unable to launch instances because there are not enough free addresses in the subnet associated with your AutoScaling group(s).”
Para resolver este problema, asegúrate de tener suficientes direcciones IP en las subredes asociadas al grupo de nodos administrado. Para obtener más información, consulta Optimizing IP address utilization.
IamInstanceProfileNotFound o IamNodeRoleNotFound
Los errores IamInstanceProfileNotFound o IamNodeRoleNotFound se producen cuando eliminas el rol o el perfil de AWS Identity and Access Management (IAM) que has asociado al grupo de nodos administrado. Para resolver este problema, crea un nuevo rol o perfil de IAM con el mismo nombre y la misma configuración que el rol o perfil eliminado.

Contenido relevante
- preguntada hace un meslg...
- preguntada hace un meslg...
- Como solucionar el error: Supplied Policy document is breaching Cloudwatch Logs policy length limit.Respuesta aceptadapreguntada hace 4 meseslg...
- preguntada hace un meslg...
- preguntada hace 3 meseslg...