Warum ist der Status von OpenSearch Dashboards in meiner Amazon-OpenSearch-Service-Domäne rot?

Letzte Aktualisierung: 30.07.2021

OpenSearch Dashboards zeigt einen roten Status auf meiner Amazon-OpenSearch-Service-Domäne (Nachfolger von Amazon Elasticsearch Service) an. Warum passiert das und wie behebe ich diesen Fehler?

Kurzbeschreibung

OpenSearch Dashboards zeigt einen grünen Status an, wenn die Zustandsprüfung jedes Knotens des OpenSearch-Service-Clusters erfolgreich ist. Wenn eine Zustandsprüfung fehlschlägt, wechselt OpenSearch Dashboards in den roten Status. OpenSearch Dashboards zeigt auch einen roten Status an, wenn sich OpenSearch Service im roten Clusterstatus befindet. Der Status von OpenSearch Dashboard kann aus folgenden Gründen zu rot wechseln:

  • Knotenausfall, der durch ein Problem mit einer Amazon-EC2-Instance (Amazon Elastic Compute Cloud) oder einem Amazon-EBS-Volume (Amazon Elastic Block Store) verursacht wurde. Weitere Informationen zu Abstürzen von Knoten finden Sie unter Warum ist mein Amazon-OpenSearch-Service-Knoten abgestürzt?
  • Unzureichender Speicher für Ihre Knoten.
  • Upgrade von OpenSearch Service auf eine neuere Version.
  • Inkompatibilität zwischen OpenSearch-Dashboards- und OpenSearch-Service-Versionen.
  • Ein Cluster mit einem Knoten läuft mit einer hohen Last und ohne dedizierte Leader-Knoten. Der dedizierte Leader-Knoten könnte auch nicht erreichbar sein. Weitere Informationen darüber, wie OpenSearch Service die Clusterstabilität erhöht, finden Sie unter Dedizierte Leader-Knoten.

Behebung

Verwenden Sie eine oder mehrere der folgenden Methoden, um den roten Status von OpenSearch Dashboards für Ihre OpenSearch-Service-Domäne zu beheben.

Hinweis: Wenn Ihr Cluster eine Circuit-Breaker-Ausnahme anzeigt, erhöhen Sie zuerst das Circuit-Breaker-Limit. Wenn keine Circuit-Breaker-Ausnahme vorliegt, probieren Sie erst die anderen Methoden aus, bevor Sie das Circuit-Breaker-Limit erhöhen.

Abfragen optimieren

Wenn Sie komplexe Abfragen ausführen (z. B. umfassende Aggregationen), sollten Sie die Abfragen optimieren, um eine maximale Leistung sicherzustellen. Plötzliche Spitzen des Heap-Speicherverbrauchs können durch die Felddaten oder Datenstrukturen verursacht werden, die für Aggregationsabfragen verwendet werden.

Überprüfen Sie die folgenden API-Aufrufe, um die Ursache der Spitzen zu ermitteln, und ersetzen Sie os-endpoint durch den Domänen-Endpunkt:

$curl os-endpoint/_nodes/stats/breaker?pretty
$curl "os-endpoint/_nodes/stats/indices/fielddata?level=indices&fields=*"

Weitere Informationen zur Verwaltung der Speichernutzung finden Sie unter Optimierung für höhere Suchgeschwindigkeit auf der Elasticsearch-Website.

Dedizierte Leader-Knoten verwenden

Eine bewährte Methode ist, drei dedizierte Leader-Knoten für jede OpenSearch-Service-Domäne zuzuweisen. Weitere Informationen zur Verbesserung der Clusterstabilität finden Sie unter Erste Schritte mit Amazon OpenSearch Service: Verwendung von dedizierten Leader-Instances zur Verbesserung der Clusterstabilität.

Hochskalieren

Um Ihre Domäne hochzuskalieren, erhöhen Sie die Anzahl der Knoten oder wählen einen Amazon-EC2-Instance-Typ mit mehr Speicherplatz aus. Weitere Informationen zur Skalierung finden Sie unter Wie kann ich meine Amazon-OpenSearch-Service-Domäne vertikal und horizontal skalieren?

Shard-Verteilung überprüfen

Überprüfen Sie den Index, in den Ihre Shards Daten laden, um zu bestätigen, dass sie gleichmäßig auf alle Datenknoten verteilt sind. Wenn Ihre Shards ungleichmäßig verteilt sind, könnte einem oder mehreren der Datenknoten der Speicherplatz ausgehen.

Verwenden Sie die folgende Formel, um zu bestätigen, dass die Shards gleichmäßig verteilt sind:

Total number of shards = shards per node * number of data nodes

Wenn der Index beispielsweise 24 Shards enthält und acht Datenknoten vorhanden sind, haben Sie drei Shards pro Knoten. Weitere Informationen zur Anzahl der benötigten Shards finden Sie unter Erste Schritte mit Amazon OpenSearch Service: Wie viele Shards brauche ich?

Versionen überprüfen

Wichtig: Ihre OpenSearch-Dashboards- und OpenSearch-Service-Versionen müssen kompatibel sein.

Führen Sie den folgenden API-Aufruf aus, um zu bestätigen, dass Ihre Versionen kompatibel sind, und ersetzen Sie os-endpoint mit durch den Domänen-Endpunkt:

$curl os-endpoint/.kibana/config/_search?pretty

Hinweis: Ein fehlgeschlagener Befehl kann auf Kompatibilitätsprobleme zwischen OpenSearch-Dashboards- und unterstützten OpenSearch-Service-Versionen hinweisen. Weitere Informationen zu kompatiblen OpenSearch-Dashboards- und Elasticsearch-Versionen finden Sie unter Einrichtung auf der Elasticsearch-Website.

Ressourcen überwachen

Richten Sie Amazon-CloudWatch-Alarme ein, die Sie benachrichtigen, wenn Ressourcen über einem bestimmten Schwellenwert verwendet werden. Wenn Sie beispielsweise einen Alarm für den JVM-Speicherdruck festlegen, können Sie Maßnahmen ergreifen, bevor der Druck 100 % erreicht. Weitere Informationen zu CloudWatch-Alarmen finden Sie unter Empfohlene CloudWatch-Alarme und Verbessern der operative Effizienz von Amazon-OpenSearch-Service-Domänen mit automatisierten Alarmen mithilfe von Amazon CloudWatch.

Circuit-Breaker-Limit erhöhen

Um zu verhindern, dass dem Cluster der Speicher ausgeht, erhöhen Sie das Parent- oder Fielddata-Circuit-Breaker-Limit. Weitere Informationen zu Fielddata-Circuit-Breaker-Limits finden Sie unter Circuit Breaker auf der Elasticsearch-Website.