Amazon Elastic Compute Cloud (Amazon EC2) Linux インスタンスが突然再起動または再開したのはなぜですか?
簡単な説明
予期せずに再起動したり再開したりすることがまれにありますが、原因はいくつかあります。最も一般的な理由は次のとおりです。
- インスタンスのステータスチェックの一方または両方が失敗した。
- インスタンスをホストしている基盤のハードウェアに障害があったため、Amazon EC2 はインスタンスを再開して新しい正常なハードウェアに移行した。
- インスタンスで定期メンテナンスが行われ、再起動が必要になった。
- サーバー内のユーザーまたはアプリケーションがインスタンスを再起動した。
- カーネルのバグ。カーネルのバグに遭遇した場合は、カーネルが完全に更新されていることを確認してください。
カーネルを更新するには、お使いの Linux オペレーティングシステム (OS) とバージョンに応じて、以下のいずれかのコマンドまたは同様のコマンドを実行します。
- sudo yum update kernel
- sudo zypper up kernel-default
- sudo apt upgrade linux-image-aws
解決策
インスタンスが再起動した理由を特定するために、以下のアクションを実行できます。
ステータスチェックを表示する
コンソールまたは AWS コマンドラインインターフェイス (AWS CLI) を使用して、インスタンスのステータスチェックを表示します。ステータスチェックが失敗した場合は、「EC2 Linux インスタンスが到達不能で、そのステータスチェックの一方、または両方が失敗するのはなぜですか?」を参照してください。
注: AWS CLI コマンドの実行中にエラーが発生した場合は、最新バージョンの AWS CLI を使用していることを確認してください。
システムログを表示する
インスタンスがステータスチェックに失敗しなかった場合は、OS レベルの問題が原因でインスタンスが再起動した可能性があります。システムログを確認して、発生したエラーを特定します。システムログは、お使いの OS ディストリビューションに応じて /var/log/messages または /var/log/syslog にあります。
インスタンスがステータスチェックに失敗した場合は、コンソール出力を使用してインスタンスを再起動し、システムログを取得できます。コンソールの出力ログを確認して、問題をトラブルシューティングしてください。詳細については、「システムログの取得」を参照してください。
- Amazon EC2 コンソールを開きます。
- [インスタンス] を選択し、インスタンスを選択します。
- [インスタンスの状態] を選択し、[インスタンスを再起動] を選択します。インスタンスの再起動には数分かかる場合があります。
- 問題がまだ存在しているか確認します。場合によっては、再起動することで問題が解決することがあります。
- インスタンスが実行状態になったら、[アクション]、[モニタリングとトラブルシューティング]、[システムログの取得] を選択します。
- 画面に表示されるログを確認します。解決策の情報については、「Linux ベースのインスタンスに関するシステムログエラーのトラブルシューティング」のログに記載されているエラーを確認してください。
再起動履歴を表示する
次のコマンドを使用して、再起動を開始したのがユーザーかサーバー内のアプリケーションかを確認します。
# grep reboot /home/*/.bash_history
# grep reboot /root/.bash_history
# history | grep -i reboot
# history | grep -i init
# last reboot
AWS CloudTrail のイベント履歴を表示する
Amazon EC2 コンソールまたは AWS CLI から開始されたインスタンスの再起動は、CloudTrail のイベント履歴に表示されます。これらのイベントを表示するには、以下の手順に従います。
- AWS CloudTrail コンソールを開きます。
- [イベント履歴] を選択します。
- フィルターのドロップダウンリストから [イベント名] を選択し、「RebootInstances」と入力します。
注: 再起動の原因となるハードウェアの問題が発生しているインスタンスを自動的に回復する、Amazon CloudWatch アラームを作成できます。CloudWatch アラームの設定方法については、「インスタンスの復旧」を参照してください。
関連情報
ステータスチェックに失敗したインスタンスのトラブルシューティング
ステータスチェックのタイプ