¿Cómo puedo solucionar los problemas de tiempo de espera de Systems Manager Run Command?

4 minutos de lectura
0

He utilizado AWS Systems Manager Run Command para ejecutar un documento de SSM en mi instancia administrada de Amazon Elastic Compute Cloud (Amazon EC2). Sin embargo, el proceso ha fallado con un error de tiempo de espera.

Descripción breve

Los detalles del estado del tiempo de espera de Run Command incluyen lo siguiente:

  • Tiempo de espera de ejecución: El tiempo, en segundos, que tarda un comando en completarse antes de que se considere que ha fallado. El valor predeterminado es 3600 (1 hora). El valor máximo es 172 800 (48 horas).
  • Tiempo de espera de entrega: El comando no se ha entregado al nodo administrado antes de que expirara el tiempo de espera total.
  • Tiempo de espera total: El valor del tiempo de espera de entrega más el tiempo de espera de ejecución. Si el documento de SSM no exige el tiempo de espera de ejecución, el tiempo de espera total es igual al tiempo de espera de entrega más el tiempo de espera de ejecución predeterminado.

Para obtener más información, consulte Comprender los estados de los comandos.

Resolución

Revisar los detalles del estado de Run Command

  1. Abra la consola de Systems Manager.
  2. En el panel de navegación, seleccione Run Command.
  3. Elija el ID del comando con hipervínculo para abrir la página Estado del comando.
  4. En la sección Objetivos y salidas, elija el ID de la instancia con hipervínculo y, a continuación, revise la salida.

Cuando la salida esté truncada, conéctese a la instancia de EC2 mediante SSH y navegue a los directorios siguientes para ver todos los detalles del error. Anote los códigos de estado de salida y, a continuación, consulte Solucionar los problemas de Systems Manager Run Command para ver los pasos adicionales de solución de problemas.

Para Linux y macOS:

/var/lib/amazon/ssm/<instance-id>/document/orchestration/<command-id>/<Plugin-name>/<Step-name>/stdout
/var/lib/amazon/ssm/<instance-id>/document/orchestration/<command-id>/<Plugin-name>/<Step-name>/stderr

Para Windows:

%ProgramData%\Amazon\SSM\InstanceData\<ManagedInstance-ID>\document\orchestration\<Command-ID>\<plug-in>\<step_number.plug-in>\stdout
%ProgramData%\Amazon\SSM\InstanceData\<ManagedInstance-ID>\document\orchestration\<Command-ID>\<plug-in>\<step_number.plug-in>\stderr

Revisar los registros de SSM Agent

Revise los registros de SSM Agent para obtener más información sobre el error.

Para Linux y macOS, busque los registros en los siguientes directorios:

/var/log/amazon/ssm/amazon-ssm-agent.log
/var/log/amazon/ssm/errors.log
/var/log/amazon/ssm/audits/amazon-ssm-agent-audit-YYYY-MM-DD

Para Windows, busque los registros en los siguientes directorios:

%PROGRAMDATA%\Amazon\SSM\Logs\amazon-ssm-agent.log
%PROGRAMDATA%\Amazon\SSM\Logs\errors.log
%PROGRAMDATA%\Amazon\SSM\Logs\audits\amazon-ssm-agent-audit-YYYY-MM-DD

Si los registros de SSM Agent no proporcionan la información que necesita para resolver el error, permita que el registro de depuración reproduzca el problema.

Solucionar problemas de tiempo de espera

  • Asegúrese de que el tiempo total necesario para completar el documento de SSM de Run Command sea inferior a la propiedad timeoutSeconds y compruebe que el tiempo total necesario para completarlo sea inferior al parámetro timeoutSeconds. El valor predeterminado de la propiedad timeoutSeconds es 3600 segundos (1 hora). Para obtener más información sobre cómo especificar el valor de la propiedad timeoutSeconds, consulte Gestionar los tiempos de espera en runbooks.
  • La instancia de EC2 debe mostrarse como un nodo administrado y el estado de ping de SSM Agent debe ser En línea. Si su instancia de EC2 no se muestra como nodo administrado o el estado de ping de SSM Agent no es En línea, es necesario solucionar problemas adicionales. Para obtener más información, consulte ¿Por qué mi instancia de EC2 no se muestra como nodo administrado o muestra el estado «Conexión perdida» en Systems Manager?
  • Si Run Command ejecuta scripts que reinician los nodos administrados, es posible que el nodo se desconecte y se produzcan problemas de tiempo de espera. Asegúrese de utilizar los códigos de salida correctos. Para obtener más información, consulte Gestionar los reinicios al ejecutar comandos.
  • Si la versión de SSM Agent es 2.0.913 o superior, el valor máximo del tiempo de espera de ejecución es 172 800 segundos (48 horas). Compruebe que la instancia utilice la versión más reciente de SSM Agent.
  • Cuando Maintenance Window o State Manager ejecuten el comando, confirme que el comando se esté ejecutando. Para confirmar, utilice AWS CloudTrail para revisar la respuesta de SendCommand.

Información relacionada

Documentos de AWS Systems Manager

Configuración de AWS Systems Manager

¿Cómo puedo solucionar los errores de Systems Manager Run Command?

OFICIAL DE AWS
OFICIAL DE AWSActualizada hace un año