Serveur freeze => analyse post-incident

0

Nous avons perdu l'accès (application & ssh) à notre serveur (EC2) ce matin 9:17 am. Le status check était en erreur. Au vu de l'urgence nous avons forcé un reboot de l'instance ce qui nous a permis de reprendre la main et accès à l'application (9:50 am). Côté OS et application nous n'avons pas de log car toute activité s'est subitement arrêtée à 9:17 am.
Nous souhaitons investiguer sur la cause post-mortem. Savez-vous s'il est encore possible d'obtenir des informations côté AWS ?

demandé il y a 10 mois859 vues
1 réponse
0

Bonjour.

Si la cause est un problème au sein du système d'exploitation EC2, contacter le support AWS ne pourra pas résoudre le problème. Si le problème concerne l'infrastructure physique exécutant EC2, vous pourrez peut-être identifier la cause en contactant le support AWS.

Je pense qu'il serait judicieux d'installer CloudWatch Agent et de sortir les journaux et les métriques sur CloudWatch afin que vous puissiez dépanner lorsque quelque chose comme cela se produit à l'avenir.
https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Install-CloudWatch-Agent.html

profile picture
EXPERT
répondu il y a 10 mois

Vous n'êtes pas connecté. Se connecter pour publier une réponse.

Une bonne réponse répond clairement à la question, contient des commentaires constructifs et encourage le développement professionnel de la personne qui pose la question.

Instructions pour répondre aux questions