Überspringen zum Hauptinhalt

Features von AWS DevOps Agent

Autonome Reaktion auf Vorfälle

Alles öffnen

    Der AWS-DevOps-Agent lässt sich in Ticketing- und Alarmsysteme wie ServiceNow integrieren, um automatisch Untersuchungen anhand von Incident-Tickets zu starten. Dadurch wird die Reaktion auf Vorfälle innerhalb Ihrer bestehenden Workflows beschleunigt und die durchschnittliche Zeit bis zur Lösung (MTTR) reduziert.

    Mithilfe des interaktiven Chats können Sie auch Ermittlungen einleiten und leiten. AWS DevOps Agent fungiert als Mitglied Ihres Betriebsteams und arbeitet direkt in Ihren Kollaborationstools wie ServiceNow und Slack, um Erkenntnisse auszutauschen und die Reaktion zu koordinieren. Erstellen Sie bei Bedarf direkt aus einer Untersuchung heraus einen AWS-Support-Fall, sodass die AWS-Support-Experten sofort einen Kontext für eine schnellere Lösung erhalten.

    AWS DevOps Agent sortiert automatisch Vorfälle und korreliert zugehörige Alarme, um festzustellen, wann sie auf dasselbe Ereignis zurückzuführen sind. Dies beschleunigt die Reaktion auf Vorfälle, da sofort verstanden wird, welche Alarme zusammenhängen und bei welchen eine separate Untersuchung erforderlich ist. Dadurch wird der Lärm reduziert und die Teams können sich zuerst auf die kritischsten Probleme konzentrieren.

    Der AWS-DevOps-Agent lässt sich in Beobachtbarkeit-Tools, Code-Repositorys und CI/CD-Pipelines integrieren, um Telemetrie-, Code- und Bereitstellung-Daten zu korrelieren und zu analysieren und die erforschten Hypothesen, Beobachtungen und Erkenntnisse zu den Ursachen zu teilen. Durch systematische Untersuchungen identifiziert AWS DevOps Agent die Hauptursache von Problemen, die auf Systemänderungen, Eingabeanomalien, Ressourcenbeschränkungen, Komponentenausfälle und Abhängigkeitsprobleme in Ihrer gesamten Umgebung zurückzuführen sind.

    Sobald AWS-DevOps-Agent die Ursache identifiziert hat, stellt er detaillierte Maßnahmenpläne zur Verfügung, die Schritte zur Behebung des Vorfalls, zur Überprüfung des Erfolgs und gegebenenfalls zur Rückgängigmachung einer Änderung umfassen. Der AWS DevOps Agent stellt auch agentenfertige Anweisungen bereit, die von einem anderen Frontier-Agenten implementiert werden können, beispielsweise Code-Verbesserungen, die vom autonomen Kiro-Agenten implementiert werden können.

    AWS DevOps Agent erweitert die Ermittlungsmöglichkeiten, indem vergangene Untersuchungen überprüft werden, um erlernte Ermittlungsfähigkeiten zu entwickeln. Die erlernte Ermittlungskompetenz analysiert vergangene Untersuchungen, um zu lernen, wie Ereignisse besser und schneller analysiert und Pläne zur Ursachenanalyse und Schadensbegrenzung erstellt werden können, sodass sie mit der Zeit intelligenter werden.

    Durch die systematische Untersuchung von Alarmen, die auf Systemänderungen, Eingabeanomalien, Ressourcenbeschränkungen, Komponentenausfälle und Abhängigkeitsprobleme in Ihrem gesamten Stack zurückzuführen sind, unterstützt AWS DevOps Agent DevOps-Teams mit gezielten Maßnahmen zur Risikominderung, wodurch die durchschnittliche Lösungszeit (MTTR) von Stunden auf Minuten reduziert wird. Beispiel:

    • Systemänderungen: Wenn ein Vorfall dadurch verursacht wird, dass Amazon DynamoDB aufgrund einer kürzlich erfolgten Codeänderung gedrosselt wird, die zu einer hohen Latenz aufgrund ineffizienter Nutzung führt, empfiehlt AWS DevOps Agent möglicherweise, die Änderung rückgängig zu machen, um sofort Abhilfe zu schaffen.
    • Systemänderungen: Wenn ein Vorfall durch Amazon SNS-Abonnementfehler aufgrund einer Nichtübereinstimmung der Filterrichtlinien nach einer Codebereitstellung verursacht wird, empfiehlt der AWS DevOps Agent möglicherweise, die Codeänderung, die die Nachrichtenstruktur verändert hat, rückgängig zu machen, um sofort Abhilfe zu schaffen, um den Nachrichtenfluss wiederherzustellen.
    • Eingabeanomalien: Wenn ein Vorfall durch eine Drosselung von AWS Lambda bei Benachrichtigungen aufgrund von hohem Datenverkehr verursacht wird, der die Grenzwerte überschreitet, empfiehlt AWS DevOps Agent möglicherweise, die Grenzwerte für die Gleichzeitigkeit als sofortige Abhilfemaßnahme zu erhöhen.
    • Eingabeanomalien: Wenn ein Vorfall durch Fehler bei der Veröffentlichung von Amazon SNS-Nachrichten aufgrund von Problemen mit der Nachrichtengröße verursacht wird, empfiehlt AWS DevOps Agent möglicherweise, als sofortige Abhilfemaßnahme eine Validierung für die Veröffentlichung von Amazon SNS-Nachrichten hinzuzufügen.
    • Ressourcenbeschränkungen: Wenn ein Vorfall durch API-Drosselung aufgrund überschrittener Ratenbeschränkungen verursacht wird, empfiehlt AWS DevOps Agent möglicherweise, als sofortige Abhilfemaßnahme die Raten-/Burst-Beschränkungen zu erhöhen.
    • Ressourcenbeschränkungen:Wenn ein Vorfall durch eine Drosselung von Amazon DynamoDB aufgrund einer überschrittenen Schreibkapazität verursacht wird, empfiehlt AWS DevOps Agent möglicherweise, die Schreibkapazität als sofortige Abhilfemaßnahme zu erhöhen.
    • Komponentenausfälle: Wenn ein Vorfall durch eine Kaltstartlatenz aufgrund einer Leistungsminderung verursacht wird, empfiehlt AWS DevOps Agent möglicherweise, die bereitgestellte Parallelität als sofortige Abhilfemaßnahme zu erhöhen.

Proaktive Prävention von Vorfällen

Alles öffnen

    AWS DevOps Agent analysiert Muster aus historischen Vorfällen, um umsetzbare Empfehlungen zu geben, die vier Schlüsselbereiche stärken: Beobachtbarkeit, Infrastrukturoptimierung, Verbesserung der Bereitstellungspipeline und Anwendungsresilienz. Beispielsweise kann der AWS DevOps Agent Testlücken identifizieren, die verhindert hätten, dass ein Problem die Produktion erreicht hätte. Zu den Empfehlungen gehören auch agentenbereite Spezifikationen, mit denen Sie die Implementierung an Ihren Programmieragenten oder einen Kollegen übergeben können, um den Anwendungs- oder Infrastrukturcode zu aktualisieren. Dies sorgt für kontinuierliche Verbesserungen, ohne dass ein Rückstand verwaltet werden muss.

    AWS DevOps Agent identifiziert Lücken in der Beobachtbarkeit-Abdeckung und Gelegenheiten, Ihre Alarme zu optimieren, wodurch die durchschnittliche Erkennungszeit (MTTD) verkürzt wird, sodass Sie Probleme erkennen können, bevor sie zu einem größeren Problem werden. Nachdem beispielsweise festgestellt wurde, dass die Erkennung von Vorfällen bei kürzlich aufgetretenen Ausfällen zu lange gedauert hat, empfiehlt AWS DevOps Agent möglicherweise die Implementierung einer Überwachung und Anomalieerkennung näher an der Fehlerquelle, um die Erkennungszeit zu verkürzen und längere Ausfälle zu vermeiden.

    Mithilfe einer Lernschleife verfeinert AWS DevOps Agent kontinuierlich seine Empfehlungen, passt sie an Ihre betrieblichen Prioritäten an und liefert auf der Grundlage des Feedbacks Ihres Teams zu den Empfehlungen zunehmend relevante Empfehlungen, die auf die Bedürfnisse Ihres Unternehmens zugeschnitten sind.

    AWS DevOps Agent analysiert Muster aus historischen Vorfällen, um gezielte Empfehlungen zu geben, die zukünftige Ausfälle verhindern und die Systemstabilität stärken. Durch die Auswertung realer Vorfälle liefert er spezifische, umsetzbare Verbesserungen, die sowohl die Häufigkeit als auch die Auswirkungen ähnlicher Probleme in vier Schlüsselbereichen reduzieren: Beobachtbarkeit, Infrastrukturoptimierung, Verbesserung der Bereitstellungspipeline und Anwendungsstabilität.

    • Verbesserung der Beobachtbarkeit: Der AWS DevOps Agent empfiehlt möglicherweise, die Alarmschwellenwerte für kritische Authentifizierungssysteme von 15 Fehlern innerhalb von 20 Minuten auf 3 Fehler innerhalb von 5 Minuten anzupassen, um die Erkennungszeit zu verkürzen und längere Integrationsausfälle zu vermeiden.
    • Verbesserung der Beobachtbarkeit: AWS DevOps Agent empfiehlt möglicherweise die Implementierung gezielter CloudWatch-Metrikfilter, um anomale „Zugriff verweigert”-Muster für IAM-Rollenänderungen zu verfolgen, was eine schnellere Erkennung im Vergleich zu einem früheren Alarm ermöglicht.
    • Verbesserung der Infrastruktur: Nach der Analyse, dass das Schema der Amazon DynamoDB-Tabelle nicht mit dem Hauptmuster zum Zugreifen des Dienstes übereinstimmt und ineffiziente vollständige Tabellenscans erzwingt, empfiehlt AWS DevOps Agent die Erstellung eines globalen sekundären Index (GSI) mit dem häufig abgefragten Attribut als Partitionsschlüssel. Dadurch würden die Vorgänge von Scans zu Abfragen umgewandelt, wodurch die Latenz von 2 500–3 500 ms auf unter 100 ms reduziert und eine Drosselung verhindert würde.
    • Infrastrukturverbesserung: Die Analyse von AWS DevOps Agent zeigt, dass die Anwendung über ausreichende Ressourcen verfügt, jedoch durch einen Single-Pod-Engpass eingeschränkt ist, bei dem alle Anforderungen während Verkehrsspitzen in einer Warteschlange zu einer Instance gesammelt werden. AWS DevOps Agent empfiehlt möglicherweise, den Kubernetes-Cluster um Horizontal Pod Autoscaler zu erweitern, wodurch der Service je nach Bedarf automatisch horizontal skaliert und die Last effektiv auf mehrere Pods verteilt wird.
    • Bereitstellungspipeline: Nach der Analyse fehlgeschlagener Amazon ECS-Bereitstellungen empfiehlt AWS DevOps Agent möglicherweise, automatische Rollbacks zu aktivieren und den Bereitstellungszustand mit Amazon EventBridge zu überwachen. Durch diese Änderungen werden Fehler bei der Zustandsprüfung des Task-Zustands schnell erkannt und behoben, wodurch Störungen bei Kundentransaktionen verhindert werden.
    • Bereitstellungspipeline: Nach der Analyse von Bereitstellungsfehlern, empfiehlt AWS DevOps Agent möglicherweise eine obligatorische Validierung der Amazon Managed Service for Prometheus-Konnektivität für Amazon ECS-Taskdefinitionen vor der Bereitstellung. Diese Empfehlung würde die Anzahl fehlgeschlagener Bereitstellungen reduzieren, indem Konnektivitätsprobleme während des Bereitstellungsprozesses erkannt werden.  

Bearbeitung von SRE-Aufgaben auf Abruf

Alles öffnen

    Stellen Sie DevOps Agent alle betrieblichen Fragen und erhalten Sie sofortige, kontextbezogene Antworten, die auf Ihrer tatsächlichen Infrastruktur basieren, ohne zwischen Konsolen oder Überwachungstools hin- und herwechseln zu müssen. Neben Fragen und Antworten können Sie benutzerdefinierte Diagramme und Berichte erstellen, speichern und teilen, z. B. tägliche Betriebszustandszusammenfassungen oder 4xx-Fehlertrends, mit denen Sie betriebliche Kennzahlen verfolgen und Erkenntnisse mit Ihrem Team kommunizieren können.

    AWS DevOps Agent bietet integrierte Integrationen mit Ihren vorhandenen Tools, darunter Beobachtbarkeitstools (CloudWatch, Dynatrace, Datadog, New Relic, Splunk), Code-Repositorys und CI/CD-Pipelines (GitHub, GitLab, Azure DevOps) und Ticketverkaufstools/Tools für die Zusammenarbeit (ServiceNow, PagerDuty, Slack), um Ursachen schnell zu identifizieren, zukünftige Vorfälle proaktiv zu verhindern und On-Demand- kontextbezogene Antworten zur Umgebung zu erhalten.

    Stellen Sie eine Verbindung zu privaten oder Remote-MCP-Servern her, um zusätzliche Tools wie geschützte Systeme, spezialisierte Plattformen, vom Kunden verwaltete Versionskontrollsysteme und interne Infrastrukturdokumentation zu integrieren. Auf diese Weise kann AWS DevOps Agent sicher auf Ihre internen Tools, Daten und Workflows zugreifen, um genauere Erkenntnisse zu erhalten und Aktionen mithilfe des realen Kontexts aus Ihrem Unternehmen zu automatisieren.

    AWS DevOps Agent lernt Ihre Umgebung kennen und erkennt automatisch Anwendungen, ihre Komponenten-Services und die Ressourcen, aus denen diese Services bestehen. Mithilfe seiner Topologiekenntnisse durchsucht der Kundendienstmitarbeiter alle konfigurierten Tools, akzeptiert Benutzereingaben und erstellt ein umfassendes Verständnis Ihrer Anwendungsressourcen, Beziehungen und Schlüsselabläufe. Er bildet diese Beziehungen in einer dynamischen, kontinuierlich aktualisierten Topologie ab, sodass Sie einen echten Überblick über Ihre Anwendungen erhalten. Durch die Korrelation dieser Live-Ressourcenübersicht mit Telemetrie-, Code- und Bereitstellungsdaten erlangt AWS DevOps Agent ein detailliertes Verständnis Ihrer Umgebung und ermöglicht so eine schnellere Lösung von Vorfällen, die proaktive Vermeidung zukünftiger Probleme und kontextsensitive Antworten, die auf der Ausführung Ihrer Anwendungen basieren.

    Fügen Sie wiederverwendbare, modulare Fähigkeiten hinzu, die der AWS DevOps Agent aufrufen kann, um Aufgaben konsistent und zuverlässig auszuführen. Mit von Kunden und Partnern definierten Fähigkeiten können Sie die Funktionen des Kundendienstmitarbeiter an Ihre Umgebung anpassen. So können Sie beispielsweise eine Fähigkeit definieren, der es AWS DevOps Agent ermöglicht, lokale Datenbankprotokolle abzufragen, indem er Kenntnisse über Protokollspeicherorte, Namenskonventionen und Abfragestrategien bereitstellt. Indem Sie das institutionelle Wissen an den Kundendienstmitarbeiter weitergeben, können Sie alles unterstützen, von der Serviceerkennung und Protokollanalytik bis hin zu Runbooks zur Reaktion auf Vorfälle und Informationen zur Teamverantwortung.

Haben Sie die gewünschten Informationen gefunden?

Ihr Feedback hilft uns, die Qualität der Inhalte auf unseren Seiten zu verbessern.