Perché il mio nodo del Servizio OpenSearch si è bloccato?
Uno dei nodi del mio cluster del Servizio OpenSearch di Amazon non funziona. Oppure i miei nodi del Servizio OpenSearch continuano a bloccarsi.
Risoluzione
I nodi del cluster potrebbero verificarsi perché l'elevata pressione della macchina virtuale Java (JVM) o l'elevato utilizzo della CPU sovraccarica il nodo. L'errore del nodo del cluster si verifica anche quando i guasti hardware causano errori nel controllo dell'integrità.
Verifica la presenza di nodi guasti
Completa i seguenti passaggi:
- Apri la console Servizio OpenSearch.
- Nel pannello di navigazione, in Cluster gestiti, scegli Domini.
- Seleziona il dominio del Servizio OpenSearch.
- Scegli la scheda Integrità del cluster, quindi seleziona Nodi. Se il numero di nodi è inferiore al numero configurato per il cluster, un nodo è inattivo.
Nota: la metrica Nodes potrebbe essere imprecisa durante le modifiche alla configurazione del cluster o la manutenzione ordinaria del servizio. Questo comportamento è normale.
Identifica e risolvi i problemi dei nodi sovraccarichi
L'elevata pressione della CPU e della JVM può causare la caduta dei nodi dal cluster a causa dell'elevato traffico. Quando un nodo non è in grado di gestire il carico, può non rispondere e bloccarsi.
Per risolvere il problema, riavvia il nodo. Assicurati di rispettare i requisiti di riavvio del nodo.
Se i problemi persistono, controlla e riduci l'utilizzo della CPU e l'utilizzo della memoria della JVM sul cluster del Servizio OpenSearch.
Identifica e risolvi i problemi di guasto hardware
I guasti hardware possono influire sulla disponibilità dei nodi del cluster. Il Servizio OpenSearch esegue controlli periodici dell'integrità di ogni nodo. Se un nodo non supera i controlli dell'integrità, il Servizio OpenSearch gli consente di riunirsi al cluster o lo sostituisce automaticamente con un nuovo nodo integro.
Utilizza la replica per ridurre il rischio di perdita dei dati
Esegui questo comando per attivare le repliche degli indici da utilizzare come backup nel caso in cui il Servizio OpenSearch sostituisca un nodo che si è bloccato:
curl -XPUT 'domain-endpoint/indexname/_settings' -H 'Content-Type: application/json' -d'{ "index" : { "number_of_replicas" : 0 }}
Nota: sostituisci domain-endpoint con l'endpoint del tuo dominio e indexname con il nome del tuo indice.
Gli shard di replica assicurano la ridondanza dei dati e consentono al cluster di continuare a soddisfare le richieste anche se uno shard primario non è disponibile. È consigliabile configurare almeno una replica per ogni indice. I cluster multinodo senza shard di replica sono a rischio di perdita di dati. Per ulteriori informazioni, consulta Dimensionamento dei domini del Servizio OpenSearch di Amazon.
È consigliabile utilizzare più di un nodo di dati in ogni cluster. Non puoi utilizzare shard di replica per cluster a nodo singolo perché non puoi assegnare shard primari e di replica allo stesso nodo. Se il nodo si blocca, si verifica una perdita di dati. Ciò si verifica anche se hai attivato il controllo degli accessi granulare per il cluster. Se il cluster a nodo singolo si blocca, utilizza uno snapshot dell'indice per ripristinare i dati persi.
Importante: puoi recuperare solo i dati acquisiti nello snapshot più recente.
Configura un dominio Multi-AZ
Quando configuri un dominio multi-AZ, il Servizio OpenSearch avvia nodi di dati in più zone di disponibilità. Il Servizio OpenSearch distribuisce gli shard primari e i relativi shard di replica in diverse zone di disponibilità. Se si verifica un errore in un nodo o in una zona, i dati sono ancora disponibili.
Informazioni correlate
Best practice operative per il Servizio OpenSearch di Amazon
Come posso aumentare orizzontalmente o verticalmente un dominio del Servizio OpenSearch?
Perché il mio dominio del Servizio OpenSearch è bloccato nello stato ?"Modifying"
- Argomenti
- Analytics
- Lingua
- Italiano
