Lightsail 인스턴스가 응답하지 않는 일반적인 문제를 해결하려면 어떻게 해야 합니까?

4분 분량
0

Amazon Lightsail 인스턴스가 응답하지 않습니다. 이 문제의 일반적인 원인은 무엇이며 문제를 해결하려면 어떻게 해야 합니까?

간략한 설명

인스턴스가 응답하지 않는 경우 상태 확인 인스턴스 지표를 검토하여 문제 해결 단계를 결정합니다. Amazon Lightsail은 두 가지 상태 확인을 통해 각 인스턴스 상태를 모니터링합니다.

시스템 상태 확인: 시스템 상태 확인은 인스턴스가 실행되는 기본 호스트에서의 문제를 탐지합니다. 네트워크, 하드웨어 또는 소프트웨어 문제로 인해 기본 호스트가 응답하지 않거나 이에 연결할 수 없는 경우 이 상태 확인에 실패합니다.

인스턴스 상태 확인: 인스턴스 상태 확인 실패는 운영 체제 수준 오류로 인해 인스턴스에 문제가 있음을 나타냅니다. OS 수준 오류에는 다음이 포함됩니다.

  • 운영 체제 부팅 실패.
  • 올바른 볼륨 마운트 실패.
  • 파일 시스템 문제.
  • 호환되지 않는 드라이버.
  • 커널 패닉.

리소스의 과도한 사용률로 인해 인스턴스 상태 확인이 실패할 수도 있습니다. 다음은 리소스 과다 사용으로 인해 상태 확인이 실패할 수 있는 가장 일반적인 세 가지 이유입니다.

  • 로드가 심한 경우 인스턴스가 버스트 가능 영역에서 작동할 수 있습니다. 이로 인해 인스턴스가 응답하지 않거나 인스턴스가 충돌할 수 있습니다.
  • 루트 디바이스가 100% 가득 차서 부팅하는 동안 인스턴스가 멈췄습니다.
  • 인스턴스에서 실행 중인 프로세스가 모든 메모리를 사용하므로 커널이 실행되지 않습니다.

해결 방법

인스턴스의 상태 확인 지표를 보고 인스턴스가 시스템 상태 확인 또는 인스턴스 상태 확인에 실패했는지 확인합니다.

시스템 상태 확인 실패

시스템 상태 확인이 실패한 경우, 인스턴스를 새 정상 호스트로 마이그레이션해야 합니다. 이렇게 하려면 해당 인스턴스를 중지했다가 시작합니다. 인스턴스를 수동으로 중지하고 시작하여 새 정상 호스트로 마이그레이션할 수 있습니다.

참고: 중지 및 시작은 재부팅과 동일하지 않습니다. 인스턴스를 정상 하드웨어로 마이그레이션하려면 시작해야 합니다.

경고: 인스턴스를 중지하고 시작하기 전에 모든 인스턴스가 중지되고 시작될 때마다 인스턴스의 퍼블릭 IP 주소가 변경된다는 점을 유의하세요. 인스턴스를 중지하고 시작할 때마다 변경되지 않는 퍼블릭 IP를 원하는 경우 고정 IP 주소를 연결할 수 있습니다.

인스턴스 상태 확인 실패

인스턴스 상태 확인에 실패한 경우 부팅 오류 또는 인스턴스 리소스의 과다 사용으로 인한 운영 체제 수준 문제가 원인일 수 있습니다. 인스턴스 상태 확인 실패의 일반적인 원인은 다음과 같습니다.

높은 CPU 사용량

인스턴스의 CPU 사용률 지표를 확인합니다. CPU 사용률이 지속 가능 영역보다 높은지, 다시 말해 인스턴스가 버스트 가능 영역에서 작동하고 부하가 많은지 확인합니다. 이 경우 다음 옵션을 사용하여 문제를 해결합니다.

  • 인스턴스를 재부팅하여 정상 상태로 되돌립니다.
    참고: 인스턴스 CPU 요구 사항이 현재 인스턴스 플랜이 제공할 수 있는 것보다 높으면 재부팅 후 문제가 다시 발생합니다.
  • CPU 요구 사항을 충족하도록 더 큰 인스턴스 플랜으로 전환하는 것이 좋습니다.

고갈된 메모리

메모리가 모두 소진되면 메모리가 부족해 커널이 실행되지 않습니다. 이 경우 메모리를 확보하기 위해 다른 프로세스가 중지되어 인스턴스가 응답하지 않게 됩니다. 재부팅을 시도하거나, 인스턴스를 중지하고 시작할 수 있습니다. 이러한 절차를 통해 메모리 사용량이 줄어듭니다.

디스크 가득 참 오류

디바이스에 남은 공간이 없고 파일 시스템이 용량에 도달했다면, 루트 디바이스가 꽉 찼기 때문에 인스턴스가 비상 모드로 전환되었을 수 있습니다. 이 문제를 해결하려면 Lightsail 플랜 또는 번들을 볼륨 크기가 더 큰 플랜으로 늘리면 됩니다.

Lightsail 플랜을 더 큰 인스턴스로 업그레이드하려면 다음을 수행합니다.

1.    인스턴스 스냅샷을 생성합니다.

2.    스냅샷에서 더 큰 인스턴스를 생성합니다.

3.    Lightsail 플랜을 업그레이드한 후 인스턴스에 연결합니다.

4.    lsblk 명령을 실행하여 디스크 레이아웃을 확인합니다. 디스크 공간이 늘어나더라도 여유 공간이 부족하여 파티션과 파일 시스템을 늘리는 자동 프로세스가 수행되지 않을 수 있습니다. 이 경우 여유 공간을 확보하고 파티션을 수동으로 늘린 다음 파일 시스템을 늘립니다. 이를 수행하기 위해 다음 명령을 실행합니다.

growpart 명령을 실행하여 루트 파티션 또는 파티션 1의 크기를 늘립니다.

$ sudo growpart /dev/xvda 1

lsblk 명령을 실행하여 파티션 1이 다음과 같이 확장되었는지 확인합니다.

$ lsblk

파일 시스템을 확장합니다. 다음 명령을 사용하여 루트 파티션 “/”의 파일 시스템을 확인합니다.

$ lsblk -f

다음 예제에서는 파티션 1의 EXT2/EXT3/EXT4 파일 시스템이 확장됩니다.

$ sudo resize2fs /dev/xvda1

다음 예제에서는 XFS 유형 파일 시스템이 확장됩니다. 이 예제에서 "/“는 볼륨 마운트 지점입니다.

$ sudo xfs_growfs -d /

파일 시스템을 확장한 후 df -h 명령을 실행하여 OS가 추가 공간을 볼 수 있는지 확인합니다.

$ df -h

기타 OS 수준 문제

다른 문제로는 부팅 문제, 커널 패닉, 네트워크 장애 등이 있습니다. 또한 블록 디바이스 오류, 소프트웨어 버그, 중단된 작업 또는 비정상적인 시스템 문제가 있을 수 있습니다. 이 모든 경우 인스턴스가 응답하지 않을 수 있습니다. 재부팅을 시도하거나, 인스턴스를 중지한 후 시작합니다. 재부팅이나 중지 및 시작을 통해 문제가 해결되지 않는 경우 추가 문제 해결을 위해 Lightsail 서버를 EC2로 마이그레이션해야 할 수 있습니다. Lightsail은 간단한 워크로드용이기 때문에 Lightsail에서는 문제 해결 옵션이 제한적이기 때문입니다.


관련 정보

Lightsail에서 내보낸 스냅샷으로부터 Amazon EC2 인스턴스 생성

AWS 공식
AWS 공식업데이트됨 3년 전