如何解决导致 Lightsail 实例无响应的常见问题?

1 分钟阅读
0

我的 Amazon Lightsail 实例没有响应。我想知道这些问题的原因以及如何解决它们。

简短描述

如果您的实例没有响应,请查看实例指标来确定如何进行故障排除。Lightsail 使用两个状态检查指标来监控实例运行状况:

系统状态检查: 检测到您的实例在上面运行的底层主机有问题。如果由于网络、硬件或软件问题,底层主机无响应或无法访问,则此状态检查会失败。

实例状态检查: 表示操作系统级问题或资源过度使用。

解决方法

系统状态检查失败

如果系统状态检查失败,则停止然后启动实例,将该实例迁移到新的运行正常的主机。

**注意:**停止然后启动并不等同于重新启动。需要启动实例才能将实例迁移到运行正常的硬件。

警告: 每次停止然后启动实例后,实例的公有 IP 地址会发生变化。如果不希望公有 IP 地址在每次停止然后启动时发生变化,请在停止实例之前附加一个静态 IP 地址

实例状态检查失败

如果实例状态检查失败,则可能是由于操作系统级别的问题所致,该问题会导致启动错误或实例资源过度使用。常见原因如下:

操作系统级别问题

可能导致实例无响应的操作系统级别问题包括启动失败、内核崩溃、网络故障、卷挂载不正确以及驱动程序不兼容。此外,可能存在块设备错误、软件错误、任务卡住或文件系统问题。要解决这些问题,请重启或停止然后启动实例。如果重启或停止然后启动无法解决问题,则可能需要将 Lightsail 服务器迁移到 Amazon EC2 以进一步故障排除。

CPU 使用率高

CPU 使用率高、实例内存耗尽和磁盘已满是资源过度利用的常见原因。

查看实例的 CPUUtilization 指标。注意 CPU 利用率是否高于可持续区域。这意味着您的实例已达到容量爆增并且负载过重。

如果实例已达到容量爆增,则使用以下方法进行故障排除:

内存耗尽

当内存耗尽时,内核没有足够的内存来运行。当这种情况发生时,其他进程将停止以释放内存,实例将变得无响应。要减少内存使用量,请重启或停止然后启动实例。

磁盘已满错误

如果根设备已满并且文件系统已达到容量,则实例可能会进入紧急模式。若要解决此问题,请增加 Lightsail 计划或将计划与卷大小更大的计划捆绑在一起。

要将 Lightsail 计划升级到更大的实例,请完成以下步骤:

  1. 创建实例的快照

  2. 从快照创建更大的实例

  3. 连接到实例。

  4. 运行 lsblk 命令来检查磁盘布局。即使磁盘空间增加,也可能缺少可用空间。当可用空间不足时,增加分区和文件系统的自动进程不会运行。如果发生这种情况,请释放一些空间,手动增加分区,然后增加文件系统。

    若要增加根分区或分区 1 的大小,请运行 growpart 命令:

    $ sudo growpart /dev/xvda 1

    要验证分区 1 是否已扩展,请运行 lsblk 命令:

    $ lsblk

    运行以下命令来扩展文件系统并验证根分区是否为“/”:

    $ lsblk -f

    运行以下命令来在分区 1 上扩展 EXT2/EXT3/EXT4 文件系统:

    $ sudo resize2fs /dev/xvda1

    运行以下命令来扩展 XFS 类型的文件系统。在此命令中,“/”是卷挂载点。

    $ sudo xfs_growfs -d /

    扩展文件系统后,运行 df -h 命令来验证操作系统是否可识别额外空间:

    $ df -h

相关信息

Create Amazon EC2 instances from exported Lightsail snapshots

AWS 官方
AWS 官方已更新 1 年前