跳至内容

如何使用 EC2Rescue 对 Amazon EC2 Windows 实例中的问题进行故障排除?

2 分钟阅读
0

我想使用 EC2Rescue 对 Amazon Elastic Compute Cloud (Amazon EC2) Windows 实例中的问题进行故障排除。

简短描述

EC2Rescue 是一款适用于 EC2 Windows Server 实例的故障排除工具。使用此工具对操作系统级别的问题进行故障排除,并收集高级日志和配置文件进行更深入的分析。您也可以使用 EC2Rescue 来解决以下问题:

  • 由于防火墙、远程桌面协议 (RDP) 或网络接口配置导致的实例连接问题。
  • 由于蓝屏或停止错误、启动循环或注册表损坏而导致的操作系统启动问题。
  • 需要高级日志分析和故障排除的其他问题。

**注意:**捕获 EC2 Windows 实例的屏幕截图来确定该实例的状态。

您可以手动或自动运行 EC2Rescue。

系统要求

EC2Rescue 需要在 Windows Server 2008 R2 或更高版本上运行且可通过 RDP 连接访问的 EC2 Windows 实例。它还需要已安装 .NET Framework 3.5 SPI 或更高版本的 EC2 Windows 实例。

**注意:**EC2Rescue 只能在 Windows Server 2008 R2 或更高版本中运行,但该工具可以分析 Windows Server 2008 或更高版本的脱机卷。

解决方法

**注意:**如果您在运行 AWS 命令行界面 (AWS CLI) 命令时收到错误,请参阅 AWS CLI 错误故障排除。此外,请确保您使用的是最新版本的 AWS CLI

使用 Systems Manager AWSSupport-ExecuteEC2Rescue Automation 文档

AWSSupport-ExecuteEC2Rescue Automation 文档将 AWS Lambda 函数与 AWS Systems Manager 和 AWS CloudFormation 操作相结合,以自动执行 EC2Rescue 步骤。

有关详细信息,请参阅在无法访问的实例上运行 EC2Rescue 工具

**重要事项:**自动化工作流会停止实例。如果实例有实例存储卷,当实例停止时,卷上的所有数据都会丢失。如果您不使用弹性 IP 地址,则会在实例停止时释放公共 IP 地址。

准备就绪后,运行 Systems Manager AWSSupport-ExecuteEC2Rescue Automation

使用 AWSSupport-RunEC2RescueForWindowsTool 运行手册

在启动 AWSSupport-RunEC2RescueForWindowsTool 运行手册之前,请确保您的 AWS Identity and Access Management (IAM) 用户或角色具有所需的权限。有关详细信息,请参阅使用 EC2Rescue 和 Systems Manager 对受损的 Windows 实例进行故障排除中的 IAM 策略示例。

完成以下步骤:

  1. 打开 AWS Systems Manager 控制台
  2. 在导航窗格中,选择 Documents(文档)。
  3. 在搜索栏中,输入 AWSSupport-RunEC2RescueForWindowsTool
  4. 选择 AWSSupport-RunEC2RescueForWindowsTool 文档。
  5. 选择 Run command(运行命令)。
  6. Command parameters(命令参数)中,为 Command(命令)选择以下参数之一:
    • ResetAccess
    • CollectLogs
    • FixAll
  7. Parameters(参数)中,输入 PowerShell 参数。
  8. 选择 Run(运行)。
  9. 自动化完成后,在 Outputs(输出)部分查看详细结果。

**注意:**确保您的实例可以访问在 AWS CLI 命令中指定的 Amazon Simple Storage Service (Amazon S3) 存储桶。

有关详细信息,请参阅 Amazon EC2 示例

手动运行 EC2Rescue

要手动运行 EC2Rescue,请使用以下方法之一:

完成以下步骤:

  1. 在您的 EC2 Windows 实例中下载 EC2Rescue zip 文件。
    **注意:**AWSSupport-RunEC2RescueForWindowsTool Systems Manager 运行命令文档方法可下载和验证适用于 Windows Server 的 EC2Rescue。
  2. 对于实例连接问题,在 Offline instance(脱机实例)模式下使用 Diagnose and Rescue(诊断和救援)功能。
    对于操作系统启动问题,在 Offline instance(脱机实例)模式下使用 Restore(恢复)功能。
    对于高级日志和故障排除,在 Current instance(当前实例)模式或 Offline instance(脱机实例)模式下使用 Capture logs(捕获日志)功能。

当前实例模式

Current instance(当前实例)模式会分析 EC2Rescue 当前运行的实例。Current instance(当前实例)模式是只读的,不会修改当前实例。此模式不能直接解决问题。使用 Current instance(当前实例)模式收集系统信息和日志进行分析或提交给系统管理员或 AWS Support。

当前实例模式有两个功能,即 System Information(系统信息)和 Capture Logs(捕获日志)。System Information(系统信息)在文本框中显示有关当前系统的重要系统信息,供您复制和粘贴。Capture Logs(捕获日志)自动收集您选择的故障排除日志并将其打包到您指定的名称和位置下的 zip 文件夹中。

脱机实例模式

Offline instance(脱机实例)模式下,您可以选择脱机系统的卷。EC2Rescue 会分析该卷并提供自动救援和恢复选项。Offline instance(脱机实例)模式提供以下功能:

  • System Information(系统信息): 在文本框中显示有关当前系统的重要系统信息,以便于高效复制。
  • Select Disk(选择磁盘): 如果有多个脱机根卷连接到实例,您可以使用此功能选择特定的卷。
    **注意:**如果所选磁盘尚未联机,则此功能会自动使磁盘联机。
  • Diagnose and Rescue(诊断和救援): 检测并提供选项自动修复阻止 RDP 连接或导致实例状态检查失败的常见配置问题。检查以下设置是否存在可能的配置问题:
    • 系统时间设置
    • Windows 防火墙设置
    • 远程桌面设置
    • EC2Config 版本和设置(Windows Server 2012 R2 及更早版本)
    • EC2Launch 版本和设置(Windows Server 2016 及更高版本)
    • 网络接口设置
  • Restore(恢复): 将脱机实例设置为启动到 Last Known Good Configuration(上次已知的正确配置)或 Restore registry from backup(从备份还原注册表)。如果您怀疑注册表配置不当或已损坏,请使用此功能。
  • Capture Logs(捕获日志): 从相关的故障排除日志列表中进行选择。然后,此功能会自动收集这些日志并将其打包到您指定的名称和位置下的压缩文件夹中。

相关信息

使用 EC2Rescue 对受损的 Amazon EC2 Linux 实例进行故障排除

使用 EC2Rescue 对受损的 Amazon EC2 Windows 实例进行故障排除

设置自动化