OpenSearch Dashboards continue d’afficher le statut rouge sur mon domaine Amazon OpenSearch Service. Quelle est la cause de ce problème, et comment puis-je le résoudre ?
Brève description
OpenSearch Dashboard affiche un statut vert lorsque toutes les surveillances de l'état passent sur chaque nœud du cluster OpenSearch Service. Le statut d'OpenSearch Dashboards est rouge lorsqu'une surveillance de l'état échoue. OpenSearch Dashboards affiche également un statut rouge lorsque le service OpenSearch est en statut de cluster rouge. Le statut d'OpenSearch Dashboards peut devenir rouge pour les raisons suivantes :
- Un nœud échoue en raison d'un problème lié à une instance Amazon Elastic Compute Cloud (Amazon EC2) ou un volume Amazon Elastic Block Store (Amazon EBS). Pour plus d'informations sur les incidents de nœuds, consultez Pourquoi mon nœud OpenSearch Service s'est-il bloqué ?
- Vos nœuds ne disposent pas d'une mémoire suffisante.
- Mise à niveau d'OpenSearch Service vers une version plus récente.
- Incompatibilité entre OpenSearch Dashboards et les versions d'OpenSearch Service.
- Un cluster à nœud unique s'exécute avec une charge importante et aucun nœud principal dédié. Le nœud leader dédié peut également être inaccessible. Pour plus d'informations sur la façon dont OpenSearch Service augmente la stabilité du cluster, veuillez consulter la rubrique Noeuds leaders dédiés.
Résolution
Utilisez une ou plusieurs des méthodes suivantes pour résoudre le statut rouge d'OpenSearch Dashboards pour votre domaine OpenSearch Service.
Remarque : si votre cluster affiche une exception de disjoncteur, augmentez d'abord la limite de celui-ci. Si vous ne disposez pas d'exception de disjoncteur, essayez les autres méthodes avant d'augmenter la limite du disjoncteur.
Ajuster les requêtes
Si vous exécutez des requêtes complexes, telles que de lourdes agrégations, alors ajustez-les afin d'optimiser les performances. Les pics soudains de consommation de la mémoire de segment peuvent être provoqués par les données de champ ou les structures de données utilisées pour les requêtes d'agrégation.
Consultez les appels d'API suivants pour identifier la cause du pic, en remplaçant le point de terminaison OS par votre point de terminaison de domaine :
$curl os-endpoint/_nodes/stats/breaker?pretty
$curl "os-endpoint/_nodes/stats/indices/fielddata?level=indices&fields=*"
Pour plus d'informations sur la gestion de l'utilisation de la mémoire, veuillez consulter Ajuster la vitesse de recherche sur le site web d'Elasticsearch.
Utiliser des nœuds leader dédiés
Une bonne pratique consiste à allouer trois nœuds leaders dédiés à chaque domaine OpenSearch Service. Pour plus d'informations sur l'amélioration de la stabilité du cluster, consultez Démarrer avec OpenSearch Service : utiliser des instances leaders dédiées pour améliorer la stabilité du cluster.
Augmenter
Pour mettre à l'échelle votre domaine, augmentez le nombre de nœuds ou choisissez un type d'instance Amazon EC2 qui contient davantage de mémoire. Pour plus d'informations sur la mise à l’échelle, veuillez consulter la rubrique Comment augmenter la capacité de mon domaine OpenSearch Service ?
Vérifier la distribution de votre partition
Vérifiez l'index d'ingestion de vos partitions pour confirmer qu'elles sont réparties uniformément entre tous les nœuds de données. Si vos partitions sont distribuées inégalement, un ou plusieurs des nœuds de données peuvent manquer d'espace de stockage.
Utilisez la formule suivante pour confirmer que les partitions sont distribuées uniformément :
Total number of shards = shards per node * number of data nodes
Par exemple, si l'index contient 24 partitions pour huit nœuds de données, vous aurez trois partitions par nœud. Pour plus d'informations sur le nombre de partitions nécessaires, consultez Get started with OpenSearch Service: How many shards do I need ?
Vérifier vos versions
Important : vos versions de tableaux de bord OpenSearch et OpenSearch Service doivent être compatibles.
Exécutez l'appel d'API suivant pour vérifier que vos versions sont compatibles, en remplaçant os-endpoint par votre point de terminaison de domaine :
$curl os-endpoint/.kibana/config/_search?pretty
Remarque : une commande qui échoue peut indiquer des problèmes de compatibilité entre OpenSearch Dashboards et les versions prises en charge par OpenSearch Service. Pour plus d'informations sur les versions compatibles OpenSearch Dashboards et Elasticsearch, veuillez consulter Configuration sur le site web Elasticsearch.
Contrôler les ressources
Configurez des alarmes Amazon CloudWatch qui vous informent lorsque l'utilisation des ressources dépasse un certain seuil. Par exemple, si vous avez défini une alarme pour la sollicitation de la mémoire de la machine virtuelle Java, prenez des mesures correctives avant d'atteindre une sollicitation de 100 %. Pour plus d'informations sur les alarmes CloudWatch, veuillez consulter les rubriques Alarmes CloudWatch recommandées et Improve the operational efficiency of Amazon OpenSearch Service domains with automated alarms using Amazon CloudWatch.
Augmenter la limite du disjoncteur
Pour éviter que le cluster manque de mémoire, essayez d'augmenter la limite du disjoncteur de données parentes ou de champ. Pour plus d'informations sur les limites des disjoncteurs de données de champ, consultez la section Disjoncteur du site web d'Elasticsearch.
Informations connexes
Impossible d'accéder à OpenSearch Dashboards
Comment puis-je résoudre l'erreur « Courier fetch: n of m shards failed » (Récupération de la messagerie : n partitions sur m ont échoué) dans les tableaux de bord OpenSearch sur Amazon OpenSearch Service ?
Comment puis-je résoudre l'erreur « cannot restore index [.kibana] because it's open » (Impossible de restaurer l'index [.kibana], car il est ouvert) dans Amazon OpenSearch Service ?
Dépannage d'une mise à niveau