Pourquoi mon instance EC2 Linux a-t-elle redémarré d’elle-même ?

Lecture de 3 minute(s)
0

Je souhaite savoir pourquoi mon instance Linux Amazon Elastic Compute Cloud (Amazon EC2) redémarre de manière inattendue.

Brève description

Votre instance peut redémarrer de manière inattendue pour les raisons suivantes :

  • L'instance échoue à ses vérifications de statut.
  • Un problème est survenu avec le matériel sous-jacent qui héberge votre instance, et Amazon EC2 redémarre l'instance pour la déplacer vers un matériel sain.
  • La maintenance planifiée de votre instance déclenche un redémarrage.
  • Un utilisateur ou une application de votre serveur redémarre l'instance.
  • Il y a un bogue dans le noyau.

Résolution

Remarque : Si des erreurs surviennent lorsque vous exécutez des commandes de l'interface de la ligne de commande AWS (AWS CLI), consultez la section Résoudre des erreurs liées à l’AWS CLI. Vérifiez également que vous utilisez bien la version la plus récente de l’AWS CLI.

Consulter votre tableau de bord Health Dashboard

L'AWS Health Dashboard signale plusieurs événements de redémarrage d'instance, tels que la restauration automatique simplifiée, la maintenance planifiée et la mise hors service. Pour agir sur les notifications de santé, reprogrammez l'événement planifié ou arrêtez et démarrez manuellement l'instance.

Afficher les vérifications de statut

Utilisez la console Amazon EC2 ou l'interface de ligne de commande AWS pour consulter les vérifications de statut de l'instance. Si un échec de vérification du statut est annoncé, consultez la page Pourquoi mon instance Linux EC2 est-elle inaccessible et échoue-t-elle à l’une de ses vérifications de statut ou aux deux ?

Afficher les journaux système

Si l'instance n'a pas échoué lors de la vérification de statut, elle peut redémarrer en raison de problèmes liés au système d'exploitation (OS). Pour résoudre les problèmes au niveau du système d'exploitation, consultez les journaux système qui se trouvent dans /var/log/messages ou /var/log/syslog.

Si la vérification de statut de l'instance a échoué, redémarrez-la pour récupérer les journaux système. Puis, résolvez l'erreur répertoriée dans le journal système.

Afficher l'historique de redémarrage

Pour vérifier si un utilisateur ou une application du serveur a lancé le redémarrage, utilisez la commande suivante :

# grep reboot /home/*/.bash_history# grep reboot /root/.bash_history
# history | grep -i reboot
# history | grep -i init
# last reboot

Consulter l’historique des événements CloudTrail

Les redémarrages d'instance que vous avez lancés sur la console Amazon EC2 ou l'interface de ligne de commande AWS apparaissent dans l'historique des événements AWS CloudTrail.

Pour consulter ces événements, procédez comme suit :

  1. Ouvrez la console CloudTrail.
  2. Dans le volet de navigation, sélectionnez Historique des événements.
  3. Dans la liste déroulante, sélectionnez Nom de l'événement, puis saisissez RebootInstances.
    Remarque : Lorsque vous créez une Amazon Machine Image (AMI), le paramètre NoReboot est défini sur faux par défaut. Étant donné qu’Amazon EC2 redémarre automatiquement l'instance avant qu'elle ne crée l'image, le redémarrage apparaît dans la piste CreateImages et non dans le journal RebootInstances.

Remarque : Vous pouvez configurer la restauration basée sur des actions Amazon CloudWatch pour récupérer automatiquement les instances qui rencontrent des problèmes matériels et qui redémarrent votre instance.

Mettre à jour votre noyau

Pour mettre à jour le noyau, exécutez l'une des commandes suivantes en fonction de votre système d'exploitation et de votre version Linux :

sudo yum update kernel
sudo zypper up kernel-default
sudo apt upgrade linux-image-aws

Informations connexes

Résoudre les problèmes liés aux instances Amazon EC2 Linux dont les contrôles de statut ont échoué

Types de vérifications de statut

Configuration des notifications des utilisateurs AWS pour AWS Health

AWS OFFICIEL
AWS OFFICIELA mis à jour il y a 3 mois