如何对处于“失败”或“待处理”状态的状态管理器关联进行故障排除?

1 分钟阅读
0

我想对处于“失败”或“待处理”状态的状态管理器关联进行故障排除。

简短描述

状态管理器是 AWS Systems Manager 的一项功能,是一项安全且可扩展的配置管理服务。状态管理器可自动将您的托管节点和其他 AWS 资源保持在您定义的状态。

AWS Systems Manager 状态管理器关联是一个分配给您的托管实例的配置。该配置定义了您希望自己实例保持的状态。

创建状态管理器关联时,Systems Manager 会将您指定的时间表、目标、文件和参数信息绑定到托管实例。当系统到达所有目标并立即应用关联中指定的状态时,关联状态为待处理

先决条件

Systems Manager 的角色和权限

要允许用户创建关联,您必须将 AWS 托管的 AmazonSSMFullAccess 策略附加到该用户。

对于 Run Command(AWS Systems Manager 的一项功能),状态管理器要求目标实例是托管实例。状态管理器需要一个 AWS Identity and Access Management(IAM)角色,该角色有权检索和运行 Systems Manager 文件。您可以在托管的 AmazonSSMManagedInstanceCore 角色策略中找到此角色所需的最低权限。

自动化关联

如果状态管理器的目标是自动化文件,则还需要权限才能运行该自动化。有关详细信息,请参阅方法 2: 使用 IAM 为自动化配置角色

连接和代理配置

验证是否配置了以下资源和设置:

  • AWS Systems Manager Agent(SSM Agent)已安装在实例上,以便使用 Run Commands。
  • 在所有目标实例上都可访问元数据,本地托管实例除外。
  • 目标实例拥有使用 TCP 443 的出站互联网连接,可以连接到 SSM 区域服务端点 ec2messages.region-id.amazonaws.comssm.region-id.amazonaws.com

对卡在“待处理”或“失败”状态的关联进行故障排除

如果关联保持在待处理失败状态,请先查看 GitHub 网站以确认您安装了最新版本的 SSM Agent。然后,检查应用关联的资源的状态,并查看历史记录以确认是否有任何调用。

要检查状态,请完成以下步骤:

  1. 打开 Systems Manager 控制台
  2. 在导航窗格中,选择状态管理器
  3. 为卡在待处理失败状态的关联选择关联 ID
  4. 选择执行历史记录选项卡,查看调用历史记录。如果历史记录中有调用,则选择执行 ID 以查看资源类型、状态和其他详细信息。
    注意:如果历史记录中未列出任何调用,请验证该实例是否为托管实例。在 Systems Manager 控制台中,实例必须列在托管实例下,并且 SSM Agent ping 状态必须为联机
  5. 选择资源 ID,然后选择目标实例执行 ID 关联执行目标
  6. 选择目标实例资源 ID,然后选择输出

输出显示有关关联失败原因的详细信息和错误消息。有关错误消息的详细信息,请参阅以下内容:

如果您的实例未出现在托管实例下,或者 SSM Agent ping 状态连接丢失,则需要进行进一步的故障排除。要对这些问题进行故障排除,请参阅为什么我的 EC2 实例在 Systems Manager 中未显示为托管节点或显示“连接丢失”状态?

**注意:**输出因您使用的 Systems Manager 文件而异。有关星系信息,请参阅 AWS Systems Manager 文档

查看 SSM Agent 日志

查看 SSM Agent 日志,了解有关 Run Command 文件失败的更多详细信息:

对于 LinuxmacOS,请在以下目录中找到日志:

  • /var/log/amazon/ssm/amazon-ssm-agent.log
  • /var/log/amazon/ssm/errors.log
  • /var/log/amazon/ssm/audits/amazon-ssm-agent-audit-YYYY-MM-DD

**注意:**SSM Agent stderrstdout 文件写入 /var/lib/amazon/ssm 目录。

对于 Windows,在以下目录中找到日志:

  • %PROGRAMDATA%\Amazon\SSM\Logs\amazon-ssm-agent.log
  • %PROGRAMDATA%\Amazon\SSM\Logs\errors.log
  • %PROGRAMDATA%\Amazon\SSM\Logs\audits\amazon-ssm-agent-audit-YYYY-MM-DD

相关信息

了解自动化状态

AWS 官方
AWS 官方已更新 1 年前