如何使用 EC2Rescue 解决我的 Amazon EC2 Windows 实例的问题?

2 分钟阅读
0

我的 Amazon Elastic Compute Cloud (Amazon EC2) Windows 实例遇到了以下问题之一: 无法连接到我的 Amazon EC2 Windows 实例。我遇到了启动问题。我需要执行恢复操作。我需要修复常见问题,例如磁盘签名冲突。我需要收集操作系统 (OS) 日志来进行分析和故障排除。

简短描述

EC2Rescue for EC2 Windows 是一款适用于 Amazon EC2 Windows Server 实例的故障排除工具。使用此工具解决操作系统级别的问题,并收集高级日志和配置文件进行进一步分析。以下是 EC2Rescue 解决的常见问题:

  • 由于防火墙、远程桌面协议 (RDP) 或网络接口配置导致的实例连接问题。
  • 由于蓝屏或停止错误、启动循环或注册表损坏而导致的操作系统启动问题。
  • 需要高级日志分析和故障排除的其他问题。

**注意:**捕获 Amazon EC2 Windows 实例的屏幕截图来确定该实例的状态。

您可以手动或自动运行 EC2Rescue。

系统要求

EC2Rescue 要求 Amazon EC2 Windows 实例满足以下条件:

  • 在 Windows Server 2008 R2 或更高版本中运行。
  • 已安装 .NET Framework 3.5 SPI 或更高版本。
  • 可通过 RDP 连接进行访问。

**注意:**EC2Rescue 只能在 Windows Server 2008 R2 或更高版本中运行,但该工具可以分析 Windows Server 2008 或更高版本的脱机卷。

解决方法

选择以下方法之一来使用 EC2Rescue 工具。

使用 Systems Manager AWSSupport-ExecuteEC2Rescue Automation 文档

AWSSupport-ExecuteEC2Rescue Automation 文档将 AWS Lambda 函数与 Systems Manager 和 AWS CloudFormation 操作相结合,以自动执行 EC2Rescue 步骤。

有关文档工作原理、权限要求和工具使用先决条件的详细信息,请参阅在无法访问的实例上运行 EC2Rescue 工具

重要事项: 自动化工作流程会停止实例。如果实例有实例存储卷,当实例停止时,卷上的所有数据都会丢失。如果您没有使用弹性 IP 地址,则会在实例停止时释放公共 IP 地址。

准备就绪后,运行 Systems Manager AWSSupport-ExecuteEC2Rescue Automation

使用 AWSSupport-RunEC2RescueForWindowsTool 运行手册

在启动 AWSSupport-RunEC2RescueForWindowsTool 运行手册之前,请确保您的 AWS Identity and Access Management (IAM) 用户或角色具有所需的权限。有关详细信息,请参阅使用 EC2Rescue 和 Systems Manager 对受损的 Windows 实例进行故障排除中的示例 IAM 策略。

**注意:**如果在运行 AWS 命令行界面 (AWS CLI) 命令时收到错误,请参阅 AWS CLI 错误故障排除。此外,请确保您使用的是最新版本的 AWS CLI。完成以下步骤:

  1. 打开 Systems Manager 控制台
  2. 在导航窗格中,选择 Documents(文档)。
  3. 在搜索栏中,输入 AWSSupport-RunEC2RescueForWindowsTool
  4. 选择 AWSSupport-RunEC2RescueForWindowsTool 文档。
  5. 选择 Run command(运行命令)。
  6. Command parameters(命令参数)中,为 Command(命令)选择以下参数之一:
    ResetAccess
    CollectLogs
    FixAll
  7. Parameters(参数)中,输入 Windows PowerShell 参数。
  8. 选择 Run(运行)。
  9. 自动化完成后,在 Outputs(输出)部分查看详细结果。

有关如何使用 Systems Manager Run Command 文档通过 AWS CLI 运行 EC2Rescue for Windows Server 的详细信息,请参阅 Amazon EC2 示例

**注意:**确保您的实例可以访问在 AWS CLI 命令中指定的 Amazon Simple Storage Service (Amazon S3) 存储桶。

手动运行 EC2Rescue

要手动运行 EC2Rescue,您可以使用以下方法之一:

完成以下步骤:

  1. 在您的 Amazon EC2 Windows 实例中下载 EC2Rescue(zip 文件)。
    **注意:**AWSSupport-RunEC2RescueForWindowsTool Systems Manager 运行命令文档方法为您下载和验证 EC2Rescue for Windows Server。
  2. 使用 EC2Rescue 解决以下 Amazon EC2 Windows Server 实例问题:
    实例连接问题: 在 Offline instance(脱机实例)模式下使用 Diagnose and Rescue(诊断和救援)功能。
    操作系统启动问题: 在 Offline instance(脱机实例)模式下使用 Restore(恢复)功能。
    高级日志和故障排除: 在当前实例模式或脱机实例模式下使用捕获日志功能。

当前实例模式

此模式会分析 EC2Rescue 当前正在运行的实例。Current instance(当前实例)模式是只读的,不会修改当前实例。此模式不能直接解决问题。使用 Current instance(当前实例)模式收集系统信息和日志进行分析或提交给系统管理员或 AWS Support。

特征

  • 系统信息: 在文本框中显示有关当前系统的重要系统信息,以便于高效复制和粘贴。
  • 捕获日志: 首先,从相关的故障排除日志列表中进行选择。然后,此功能会自动收集这些日志并将其打包到您指定的名称和位置下的压缩文件夹中。

脱机实例模式

您可以在这一模式下选择脱机系统卷。EC2Rescue 会分析卷并提供自动救援和恢复选项。离脱机实例模式还包括与当前实例模式相同的捕获日志功能。

**特征 **

  • 系统信息: 在文本框中显示有关当前系统的重要系统信息,以便于高效复制。
  • 选择磁盘: 如果有多个离线根卷连接到实例,则此功能允许您选择特定的卷。
    **注意:**如果所选磁盘尚未联机,则此功能会自动使磁盘联机。
  • 诊断和救援: 检测并提供选项自动修复阻止 RDP 连接或导致实例状态检查失败的常见配置问题。检查以下项目是否存在可能的配置问题:
    系统时间设置
    Windows 防火墙设置
    远程桌面设置
    EC2Config 版本和设置(Windows Server 2012 R2 及更早版本)
    EC2Launch 版本和设置(Windows Server 2016 及更高版本)
    网络接口设置
  • 恢复: 将脱机实例设置为启动到上次已知的正确配置从备份还原注册表。如果您怀疑注册表配置不当或已损坏,请使用此功能。
  • 捕获日志: 首先,从相关的故障排除日志列表中选择。然后,此功能会自动收集这些日志并将其打包到您指定的名称和位置下的压缩文件夹中。

相关信息

使用 EC2Rescue 对受损的 Amazon EC2 Linux 实例进行故障排除

使用 EC2Rescue 对受损的 Amazon EC2 Windows 实例进行故障排除

设置自动化

AWS 官方
AWS 官方已更新 6 个月前