Passer au contenu

Comment résoudre les problèmes de redémarrage ou de basculement inopiné dans mes instances de base de données Aurora compatible avec PostgreSQL ?

Lecture de 4 minute(s)
0

Je souhaite déterminer la cause du redémarrage ou du basculement inopiné de mes instances de base de données (DB) Amazon Aurora édition compatible avec PostgreSQL et éviter que cette situation ne se reproduise à l'avenir.

Brève description

Des redémarrages inattendus dans les instances de base de données Aurora compatible avec PostgreSQL peuvent survenir en raison de pannes matérielles, d'une utilisation élevée des ressources, d'une latence de réplication ou de problèmes logiciels.

Résolution

Vérifier les événements Amazon RDS pour votre instance de base de données

Procédez comme suit :

  1. Ouvrez la console Amazon Relational Database Service (Amazon RDS).
  2. Dans le volet de navigation, sélectionnez Évènements.
  3. Recherchez les événements qui se sont produits au moment du redémarrage de votre instance de base de données.

Pour plus d'informations, consultez les sections Affichage des événements Amazon RDS et Utilisation de notifications d'événements Amazon RDS.

Analyser les métriques des instances de base de données (DB)

Procédez comme suit :

  1. Ouvrez la console Amazon RDS.
  2. Dans le volet de navigation, sélectionnez Bases de données.
  3. Sélectionnez votre instance de base de données.
  4. Choisissez l'onglet Surveillance.
  5. Examinez les métriques suivantes :<br id=hardline_break/> Dans CPUUtilization, vérifiez si l'utilisation élevée du processeur est continue.<br id=hardline_break/> Dans DatabaseConnections, vérifiez que le nombre de connexions ne dépasse pas le quota.<br id=hardline_break/> Dans FreeableMemory, vérifiez qu’une quantité de mémoire suffisante est disponible.<br id=hardline_break/> Dans ReadIOPS et WriteIOPS, recherchez des modèles d'E/S inhabituels.<br id=hardline_break/> (Instances de lecteur uniquement) Dans AuroraReplicaLag, vérifiez les valeurs de latence de réplication.
  6. Recherchez l’existence d’anomalies ou de pics susceptibles d'avoir provoqué le redémarrage.

Pour plus d'informations, consultez la section Surveillance des métriques Amazon Aurora avec Amazon CloudWatch.

Examiner CloudWatch Database Insights

Procédez comme suit :

  1. Ouvrez la console Amazon RDS.
  2. Dans le volet de navigation, choisissez Database Insights.
  3. Dans le volet Database Insights, sélectionnez votre instance de base de données dans la liste.
  4. Analysez les principales requêtes SQL et attendez les événements au moment du redémarrage.

Pour plus d'informations, consultez la section Surveillance des bases de données Amazon Aurora avec CloudWatch Database Insights.

Vérifier l’existence de problèmes matériels

Si vous suspectez une panne matérielle, contactez AWS Support pour résoudre le problème. AWS Support peut vérifier si un problème au niveau de l'hôte a provoqué le redémarrage.

Consulter les journaux de base de données

Procédez comme suit :

  1. Ouvrez la console Amazon RDS.
  2. Dans le volet de navigation, sélectionnez Bases de données.
  3. Sélectionnez votre instance de base de données.
  4. Choisissez l'onglet Journaux et événements.
  5. Dans la section Journaux, téléchargez et consultez les fichiers journaux de PostgreSQL pour détecter les erreurs ou les avertissements au moment du redémarrage.

Pour plus d'informations sur les fichiers journaux de base de données Aurora PostgreSQL, consultez la section Fichiers journaux de base de données Aurora PostgreSQL.

Vérifier l’existence d’une maintenance en attente

Procédez comme suit :

  1. Ouvrez la console Amazon RDS.
  2. Dans le volet de navigation, sélectionnez Bases de données.
  3. Sélectionnez votre instance de base de données.
  4. Choisissez l'onglet Maintenance et sauvegardes.
  5. Si une maintenance est en attente, choisissez Appliquer maintenant ou Appliquer à la fenêtre de maintenance suivante.

Créer une alarme

Configurez des alarmes CloudWatch pour des métriques critiques, telles que l'utilisation du processeur, l'utilisation de la mémoire et la latence de réplication.

Optimiser l'utilisation des ressources

Effectuez les opérations suivantes :

Augmenter vos ressources

Si vous constatez régulièrement une utilisation élevée des ressources, augmentez votre type d'instance ou ajoutez des réplicas Aurora.

Maintenir votre base de données à jour

Pour résoudre les bogues et améliorer les performances, appliquez régulièrement des correctifs et des mises à niveau de version.

Mettre en œuvre la haute disponibilité

Pour une seule instance, utilisez les déploiements d'instances de base de données multi-AZ. Pour les clusters Aurora, assurez-vous de disposer d'au moins une instance de lecteur qu'Aurora peut promouvoir en cas de problèmes d'instance d’écriture.

Pour plus d'informations, consultez la section Haute disponibilité pour Amazon Aurora.

Informations connexes

Outils de surveillance pour Amazon Aurora

Comment résoudre les problèmes qui entraînent le retard et le redémarrage de mon réplica en lecture Aurora ?

Basculement rapide avec Amazon Aurora PostgreSQL

AWS OFFICIELA mis à jour il y a 5 mois