Passer au contenu

Pourquoi mon instance Amazon EC2 Linux a-t-elle redémarré d’elle-même ?

Lecture de 5 minute(s)
0

Je souhaite savoir pourquoi mon instance Linux Amazon Elastic Compute Cloud (Amazon EC2) redémarre de manière inattendue.

Brève description

Votre instance peut redémarrer de manière inattendue pour les raisons suivantes :

  • L'instance a échoué à ses vérifications de statut.
  • Un problème est survenu avec le matériel sous-jacent qui héberge votre instance, et Amazon EC2 a redémarré l'instance pour la déplacer vers un matériel sain.
  • La maintenance planifiée de votre instance a déclenché un redémarrage.
  • Un utilisateur ou une application de votre serveur a redémarré l'instance.
  • Il y a un bogue dans le noyau.
  • Vous avez activé l'instance de redémarrage lors de la création d'une Amazon Machine Image (AMI).
  • AWS Systems Manager a redémarré une instance gérée.

Résolution

Remarque : Si des erreurs surviennent lorsque vous exécutez des commandes de l'interface de la ligne de commande AWS (AWS CLI), consultez la section Résoudre des erreurs liées à l’AWS CLI. Vérifiez également que vous utilisez bien la version la plus récente de l’AWS CLI.

Consulter votre tableau de bord Health

Recherchez dans le tableau de bord AWS Health des événements de redémarrage d'instance, tels que la restauration automatique simplifiée, la maintenance planifiée et la mise hors service. Pour agir sur les notifications d’état, reprogrammez l'événement planifié ou arrêtez et démarrez manuellement l'instance.

Afficher les vérifications de statut

Utilisez la console Amazon EC2 ou l'AWS CLI pour consulter les vérifications de statut de l'instance. Si l'instance a échoué lors d'une vérification de statut, consultez la section Comment résoudre les échecs de vérification de statut pour mon instance Linux EC2 ?

Consulter les journaux système

Si l'instance n'a pas échoué à une vérification de statut, elle peut redémarrer en raison de problèmes liés au système d'exploitation (OS). Pour résoudre les problèmes au niveau du système d'exploitation, consultez les journaux système /var/log/messages et /var/log/syslog. Si la vérification de statut de l'instance a échoué, redémarrez-la pour récupérer les journaux système.

Puis, résolvez l'erreur répertoriée dans le journal système.

Consulter l'historique de redémarrage

Pour vérifier si un utilisateur ou une application du serveur a lancé le redémarrage, exécutez les commandes suivantes :

grep reboot /home/*/.bash_history
grep reboot /root/.bash_history
history | grep -i reboot
history | grep -i init
last reboot

Consulter l'historique des événements CloudTrail

Les redémarrages d'instance que vous avez lancés sur la console Amazon EC2 ou l'interface de ligne de commande AWS apparaissent dans l'historique des événements AWS CloudTrail. Recherchez dans votre historique d’événements CloudTrail des événements RebootInstances.

Remarque : Lorsque vous créez une AMI, Amazon EC2 active Redémarrer l'instance par défaut et redémarre l'instance avant de créer l'AMI. Ce redémarrage apparaît dans l'événement CreateImage, et non dans l'événement RebootInstances.

Si vous avez créé une politique de cycle de vie de l’AMI, sous Redémarrage de l'instance, vérifiez si vous avez défini Redémarrer l'instance lors de l'exécution de la politique sur Oui. Si tel est le cas, l'instance a redémarré lors de la création de l'AMI.

Pour restaurer automatiquement les instances qui redémarrent en raison de problèmes matériels, configurez la restauration basée sur les actions Amazon CloudWatch.

Mettre à jour votre noyau

Remarque : Il est recommandé de créer une sauvegarde AMI de l'instance avant de mettre à jour les packages qu'elle contient. Cette configuration vous permet d'annuler les modifications, si nécessaire.

Pour mettre à jour votre noyau, procédez comme suit :

  1. Pour vérifier la version du noyau utilisée par l'instance, exécutez la commande suivante :

    sudo uname -r
  2. Pour mettre à jour le noyau, exécutez l'une des commandes suivantes en fonction de votre système d'exploitation Linux.
    Red Hat Enterprise Linux (RHEL) ou Amazon Linux :

    sudo yum update kernel

    Serveur SUSE Linux Enterprise (SLES) :

    sudo zypper up kernel-default

    Ubuntu :

    sudo apt upgrade linux-image-aws
  3. Pour redémarrer l'instance et utiliser le nouveau noyau, exécutez la commande suivante :

    sudo reboot

Consulter l'historique de commandes d'exécution pour vérifier si Systems Manager a redémarré l'instance

Si vous configurez une opération d'application de correctifs sur votre instance avec RebootOption défini sur RebootIfNeeded, Systems Manager redémarre l'instance pendant l’application d’un correctif.

Pour vérifier si Systems Manager a exécuté une commande d’exécution, procédez comme suit :

  1. Ouvrez la console Systems Manager.
  2. Dans le volet de navigation, sélectionnez Commande d’exécution.
  3. Cliquez sur l’onglet Historique de commandes.
  4. Dans la zone de recherche, saisissez l'ID de votre instance pour afficher toutes les commandes que Systems Manager a exécutées pour l'instance.

Informations connexes

Résoudre les problèmes liés aux instances Amazon EC2 Linux dont les contrôles de statut ont échoué

Types de vérifications de statut

Gérer les notifications AWS Health dans les notifications des utilisateurs AWS

Comment revenir à un noyau stable connu après qu'une mise à jour bloque le redémarrage de mon instance EC2 ?

AWS OFFICIELA mis à jour il y a 9 mois