Perché OpenSearch Dashboards si trovano nello stato rosso nel mio dominio Amazon OpenSearch Service?

Ultimo aggiornamento: 30/07/2021

I dashboard OpenSearch continuano a mostrare lo stato rosso sul mio dominio Amazon OpenSearch Service (successore di Amazon Elasticsearch Service). Perché ciò sta accadendo e come risolverlo?

Breve descrizione

OpenSearch Dashboards mostra lo stato verde quando tutti i controlli di integrità passano su ogni nodo del cluster OpenSearch Service. Se un controllo dell’integrità non riesce, OpenSearch Dashboards entra in rosso. OpenSearch Dashboards mostra anche lo stato rosso quando OpenSearch Service è in stato di cluster rosso. Lo stato di OpenSearch Dashboard può diventare rosso per i seguenti motivi:

  • Errore del nodo causato da un problema con un'istanza Amazon Elastic Compute Cloud (Amazon EC2) o un volume Amazon Elastic Block Store (Amazon EBS). Per ulteriori informazioni sugli arresti anomali dei nodi, consulta Perché il mio nodo Amazon OpenSearch Service si è arrestato in modo anomalo?
  • Memoria insufficiente per i nodi.
  • Aggiornamento di OpenSearch Service a una versione più recente.
  • Incompatibilità tra le versioni di OpenSearch Dashboards e OpenSearch Service.
  • Un cluster a nodo singolo è in esecuzione con un carico pesante e senza nodi leader dedicati. Anche il nodo leader dedicato potrebbe non essere raggiungibile. Per ulteriori informazioni su come OpenSearch Service aumenta la stabilità del cluster, consulta Nodi leader dedicati.

Risoluzione

Utilizzare uno o più dei seguenti metodi per risolvere lo stato rosso di OpenSearch Dashboards per il dominio OpenSearch Service.

Nota: se il cluster mostra un'eccezione dell'interruttore automatico, in primo luogo aumentare il limite dell'interruttore automatico. Se non si dispone di un'eccezione per l'interruttore automatico, provare gli altri metodi prima di aumentare il limite dell'interruttore automatico.

Ottimizzare le query

Se vengono eseguite query complesse (ad esempio aggregazioni pesanti), ottimizzare le query per ottenere le massime prestazioni. Picchi improvvisi nel consumo di memoria heap possono essere causati dai dati del campo o dalle strutture dati utilizzate per le query di aggregazione.

Esamina le seguenti chiamate API per individuare il motivo del picco, sostituendo l'endpoint del sistema operativo con l'endpoint del dominio:

$curl os-endpoint/_nodes/stats/breaker?pretty
$curl "os-endpoint/_nodes/stats/indices/fielddata?level=indices&fields=*"

Per ulteriori informazioni sulla gestione dell'utilizzo della memoria, consulta Ottimizzazione della velocità di ricerca sul sito Web di Elasticsearch.

Utilizzo dei nodi leader dedicati

È consigliabile allocare tre nodi leader dedicati per ogni dominio di OpenSearch Service. Per ulteriori informazioni su come migliorare la stabilità del cluster, consultare Introduzione ad Amazon OpenSearch Service: utilizzare istanze leader dedicate per migliorare la stabilità del cluster.

Scalare

Per aumentare il proprio dominio, aumenta il numero di nodi o scegli un tipo di istanza Amazon EC2 che contiene più memoria. Per ulteriori informazioni sul ridimensionamento, consulta Come posso aumentare o ridimensionare il mio dominio Amazon OpenSearch Service?

Controllo della distribuzione delle partizioni

Controllare l'indice in cui vengono inseriti i propri shard per verificare che siano distribuiti uniformemente su tutti i nodi di dati. Se i propri shard sono distribuiti in modo non uniforme, uno o più nodi di dati potrebbero esaurire lo spazio di archiviazione.

Utilizza la seguente formula per confermare che le partizioni sono distribuite uniformemente:

Total number of shards = shards per node * number of data nodes

Ad esempio, se nell'indice sono presenti 24 partizioni e vi sono otto nodi di dati, si avranno tre partizioni per nodo. Per ulteriori informazioni sul numero di shard necessari, consulta Introduzione ad Amazon OpenSearch Service: quante partizioni sono necessarie?

Verificare le versioni

Importante: le versioni di OpenSearch Dashboards e OpenSearch Service devono essere compatibili.

Eseguire la seguente chiamata API per verificare che le versioni siano compatibili, sostituendo l’endpoint del sistema operativo con l'endpoint del proprio dominio:

$curl os-endpoint/.kibana/config/_search?pretty

Nota: un comando non riuscito può indicare problemi di compatibilità tra le versioni di OpenSearch Dashboards e OpenSearch Service supportate. Per ulteriori informazioni sulle versioni di OpenSearch Dashboards ed Elasticsearch compatibili, consulta Configurazione sul sito Web di Elasticsearch.

Monitoraggio delle risorse

Configurare allarmi Amazon CloudWatch che avviseranno quando le risorse vengono utilizzate al di sopra di una determinata soglia. Ad esempio, se si imposta un allarme per la pressione della memoria JVM, intervenire prima che la pressione raggiunga il 100%. Per ulteriori informazioni sugli allarmi CloudWatch, consulta Allarmi CloudWatch consigliati e Miglioramento dell'efficienza operativa dei domini Amazon OpenSearch Service con allarmi automatici tramite Amazon CloudWatch.

Aumentare il limite dell'interruttore automatico

Per evitare che la memoria del cluster si esaurisca, provare ad aumentare il limite dell'interruttore automatico dati padre o di campo. Per ulteriori informazioni sui limiti dell'interruttore automatico dei dati di campo, consultare Interruttore automatico sul sito Web Elasticsearch.