Überspringen zum Hauptinhalt

AWS DevOps Agent

Sorgen Sie für betriebliche Exzellenz – mit einem autonomen Agenten, der Vorfälle löst und proaktiv verhindert

Warum AWS DevOps Agent?

Der AWS DevOps Agent ist ab sofort allgemein verfügbar und fungiert als Ihr immer verfügbarer Teamkollege im Betrieb, der Vorfälle behebt und proaktiv verhindert, die Zuverlässigkeit und Leistung von Anwendungen optimiert und SRE-Aufgaben nach Bedarf in AWS-, Multi-Cloud- und lokalen Umgebungen übernimmt. Er untersucht Vorfälle und ermittelt Möglichkeiten zur Betriebsoptimierung, genau wie es ein erfahrener DevOps-Engineer tun würde: Er lernt Ihre Anwendungen und deren Zusammenhänge kennen, arbeitet mit Ihren Beobachtbarkeitstools, Runbooks, Code-Repositorys und CI/CD-Pipelines und setzt Telemetrie-, Code- und Bereitstellungsdaten in Zusammenhang bei allen Umgebungen. Stellen Sie Fragen, erhalten Sie sofort kontextbezogene Antworten und erstellen Sie benutzerdefinierte Diagramme und Berichte, die Sie speichern und mit Ihrem Team teilen können.

Vorteile

    AWS DevOps Agent ist Ihr stets verfügbarer, autonomer Bereitschaftsingenieur. Es beginnt mit der Untersuchung, sobald eine Warnung eingeht, sei es um 2 Uhr morgens oder zu Spitzenzeiten, um die optimale Leistung Ihrer Anwendung schnell wiederherzustellen. AWS DevOps Agent untersucht Vorfälle rund um die Uhr autonom und bietet Ursachenanalysen und Maßnahmen zur Behebung. Es nutzt sein Verständnis Ihrer Anwendungsressourcen und Beziehungen, um Abhängigkeiten und Interaktionen schnell zu verstehen. AWS DevOps Agent optimiert die Vorfallreaktion, indem Beobachtungen, Erkenntnisse und Abhilfemaßnahmen automatisch über Ihre bevorzugten Kommunikationskanäle wie Slack, ServiceNow und PagerDuty weitergeleitet werden.

    AWS DevOps Agent analysiert Muster aus historischen Vorfällen, um umsetzbare Empfehlungen zu geben, die vier Schlüsselbereiche stärken: Beobachtbarkeit, Infrastrukturoptimierung, Verbesserung der Bereitstellungspipeline und Anwendungsresilienz. Zu den Empfehlungen gehören agentenbereite Spezifikationen, mit denen Sie die Implementierung an Ihren Programmieragenten oder einen Kollegen übergeben können, um den Anwendungs- oder Infrastrukturcode zu aktualisieren. Dies sorgt für kontinuierliche Verbesserungen, ohne dass ein Rückstand verwaltet werden muss.

    Mit AWS DevOps Agent können Sie auf bisher ungenutzte Erkenntnisse in Ihren Betriebsdaten zugreifen, indem Sie ihn sicher in Ihre Workflows und Beobachtbarkeits-Tools, Runbooks, Code-Repositorys und CI/CD-Pipelines integrieren. AWS DevOps Agent bietet integrierte Integrationen mit Beobachtbarkeits-Tools wie Amazon CloudWatch, Dynatrace, Datadog, Grafana, New Relic und Splunk sowie Code-Repositorys und CI/CD-Pipelines wie Azure DevOps, GitHub und GitLab. Sie können AWS DevOps Agent über seine integrierten Integrationen hinaus erweitern, indem Sie eine sichere Verbindung zu Ihrem eigenen oder Remote-MCP-Server herstellen und so Integrationen mit zusätzlichen Tools wie den benutzerdefinierten Tools Ihres Unternehmens, spezialisierten Plattformen oder proprietären Ticketingsystemen ermöglichen.

    AWS DevOps Agent nutzt sein tiefes Verständnis Ihrer Umgebung und ermöglicht es Ihnen, tiefer in Ihre Anwendungsumgebung einzutauchen und nicht nur Fragen zu stellen, sondern benutzerdefinierte Diagramme und Berichte zu erstellen, zu speichern und zu teilen. Fragen Sie den Zustand der Ressourcen ab, untersuchen Sie Vorfallmuster, verfolgen Sie Einsätze und informieren Sie sich über Präventionsempfehlungen – alles über eine Oberfläche in natürlicher Sprache. Erstellen, speichern und teilen Sie benutzerdefinierte Diagramme und Berichte, mit denen Sie betriebliche Kennzahlen verfolgen und Erkenntnisse mit Ihrem Team kommunizieren können.

Kunden

United Airlines

„Bei United Airlines befördern wir täglich mehr als 500 000 Passagiere. Wir haben etwa 38 000 Dynatrace OneAgents, die in einer Hybrid-Cloud-Umgebung überwachen, mehr als 500 AWS-Konten, 20 000 AWS-Lambda-Funktionen, Amazon ECS-Microservices und zahlreiche andere Services. In dieser Größenordnung haben wir zuvor mehrere Tools verwendet, die dieselben Funktionen in verschiedenen Bereichen ausführen, was bei der Problembehandlung zu Lücken und Black Boxen geführt hat. Der AWS DevOps Agent mit Dynatrace ändert das komplett. Dynatrace erkennt schnell und präzise Probleme, identifiziert die verantwortliche Anwendungsebene, und dann untersucht der Kundendienstmitarbeiter weiter und schlägt präzise Schritte zur Lösung des Problems vor – alles direkt in Dynatrace. Anstatt um 3:00 Uhr morgens einen Notruf einzuleiten und zwischen den Tools zu wechseln, haben wir jetzt die Antworten parat – eine einzige Glasscheibe.“

Jason Eckhart, Principal Engineer, Zuverlässigkeit und Beobachtbarkeit, United Airlines

Missing alt text value

T-Mobile

„Als AWS den DevOps Agent einführte, hat T-Mobile vom ersten Tag an mit am Tisch gesessen. Als Designpartner haben wir gesehen, wie AWS DevOps Agent die Ursachenanalyse in Produktionsumgebungen erheblich verbessern kann. Unser Feedback aus der Praxis hat direkt die Entwicklung des Produkts beeinflusst. 

Unsere Infrastruktur umfasst mehrere Clouds und lokale Umgebungen, wobei die Anwendungsprotokolle in unserer lokalen Splunk-Bereitstellung zentralisiert sind. Die Fähigkeit von AWS DevOps Agent, sich nahtlos in Splunk zu integrieren und Protokolle in diesen unterschiedlichen Umgebungen zu analysieren, hat sich bei der weiteren Erprobung der Lösung als sehr positiv erwiesen.“

Aravind Manchireddy, SVP, Technology Operations, T-Mobile

Missing alt text value

Western Governors University

Die Western Governor's University (WGU), eine führende Online-Universität mit über 191 000 Studenten, gehörte zu den ersten Organisationen, die Amazon DevOps Agent in der Produktion einführten, und zwar noch vor dem Start der Vorversion auf re:Invent. Als großer Dynatrace-Anwender nutzt WGU die native Dynatrace-Integration des DevOps Agents, sodass Dynatrace Intelligence Problemdatensätze zur Untersuchung automatisch an den Kundendienstmitarbeiter weiterleiten und angereicherte Ergebnisse direkt an Dynatrace zurücksenden kann.

Bei einer kürzlich durchgeführten Produktionsuntersuchung analysierte das SRE-Team von WGU den DevOps Agent, um ein Szenario einer Serviceunterbrechung zu analysieren. Dadurch wurde die Gesamtlösungszeit von geschätzten zwei Stunden auf nur 28 Minuten reduziert – eine Verbesserung der MTTR um 77 %. Der Kundendienstmitarbeiter lokalisierte schnell die Ursache in der Konfiguration einer Lambda-Funktion und brachte wichtige betriebliche Erkenntnisse zum Vorschein, die zuvor nur in unentdeckter interner Dokumentation vorhanden waren.

„Er war in der Lage, den schlagenden Beweis zu liefern und stellte fest, dass das Lambda die Ursache war. Die Untersuchung hatte fast makellose Kennzahlen, die mit denen übereinstimmten, die wir im Frontend gesehen haben.“ Er fügte hinzu: „Gestern war ein großer Sieg. Wenn wir die Entdeckung weiter beschleunigen können, kann ich nicht beschreiben, wie groß der Sieg für unser Unternehmen wäre.“ Mit Plänen, das Feature DevOps Agent Skills zu nutzen, ist die WGU auf dem besten Weg, die Untersuchungszeit noch weiter zu verkürzen.

Angel Marchena, Director of Technical Operations, Western Governors University

Missing alt text value

Zenchef

Zenchef ist eine Technologieplattform für Restaurants, mit der Restaurants Reservierungen, Tischoperationen, digitale Menüs, Zahlungen und Gästemarketing über ein einziges, provisionsfreies System verwalten können. Mit einem fokussierten DevOps-Team, das mehrere Produktionsumgebungen in mehreren Geschäftsbereichen verwaltete, standen sie vor einer echten Prüfung, als während eines Unternehmens-Hackathons ein API-Integrationsproblem auftauchte, das einen Downstream-Partner betraf. Techniker waren an der Veranstaltung beteiligt und nichts Signifikantes zeigte sich in der Überwachung, das sie in die richtige Richtung wies.

Anstatt die Entwickler vom Hackathon abzuhalten, brachte das Team das Problem zu DevOps Agent. Das Problem wurde systematisch gelöst, wobei die Authentifizierung als beitragender Faktor ausgeschlossen wurde, der Schwerpunkt der Untersuchung auf ECS-Bereitstellungen verlagert wurde und die Ursache letztendlich auf eine Code-Regression zurückgeführt wurde, bei der eine neue Version einen unbekannten Aufzählungswert in der Datenbank nicht verarbeiten konnte. Die vollständige Untersuchung dauerte 20 bis 30 Minuten, was einer Verkürzung von etwa 75 % gegenüber den 1–2 Stunden entspricht, die sie manuell in Anspruch genommen hätte. Die Ergebnisse wurden direkt mit dem zuständigen Ingenieur geteilt.

„Während des Hackathons hatten wir fast keine verfügbare Bandbreite, um das zu untersuchen – und wir brauchten sie auch nicht. Wir versuchen immer, ein paar Schritte voraus zu sein, und diese Art der proaktiven Untersuchung ist sonst einfach nicht immer möglich. DevOps Agent ermöglicht neue Möglichkeiten, das Verhalten unserer Plattformen zu verstehen.“

Theo Massard, Platform Engineering Manager, Zenchef

Missing alt text value

Anwendungsfälle

Vorfallreaktion und -lösung

AWS DevOps Agent untersucht selbstständig Vorfälle und führt Teams zu einer schnellen Lösung. AWS DevOps Agent lässt sich in Beobachtbarkeits-Tools, Code-Repositorys und CI/CD-Pipelines integrieren, um Telemetrie-, Code- und Bereitstellungsdaten zu korrelieren und zu analysieren und ihre Hypothesen, Beobachtungen und Erkenntnisse auszutauschen. Durch systematische Untersuchungen identifiziert AWS DevOps Agent die Hauptursache von Problemen, die auf Systemänderungen, Eingabeanomalien, Ressourcenbeschränkungen, Komponentenausfälle und Abhängigkeitsprobleme in Ihrer gesamten Umgebung zurückzuführen sind.

Automatisierte Vorfallkoordination

Mithilfe des interaktiven Chats können Sie Ermittlungen einleiten und leiten. AWS DevOps Agent fungiert als Mitglied Ihres Betriebsteams und arbeitet direkt in Ihren Kollaborationstools wie ServiceNow und Slack, um Erkenntnisse auszutauschen und die Reaktion zu koordinieren. Erstellen Sie bei Bedarf direkt aus einer Untersuchung heraus einen AWS-Support-Fall, sodass die AWS-Support-Experten sofort einen Kontext für eine schnellere Lösung erhalten.

Zukünftigen Betriebsstörungen vorbeugen

AWS DevOps Agent analysiert Muster historischer Vorfälle und gibt umsetzbare Empfehlungen, die 4 Schlüsselbereiche stärken: Beobachtbarkeit, Infrastrukturoptimierung, Verbesserung der Bereitstellungs-Pipeline und Ausfallsicherheit von Anwendungen. 

Beschleunigte Bearbeitung von On-Demand-SRE-Aufgaben auf Abruf

Erhalten Sie sofortige, kontextbezogene Antworten auf betriebliche Fragen, ohne zwischen den Konsolen hin- und herwechseln zu müssen. Fragen Sie den Zustand der Ressourcen ab, untersuchen Sie Vorfallmuster, verfolgen Sie Bereitstellungen und lassen Sie sich Empfehlungen durch natürliches Gespräch einfallen. Neben Fragen und Antworten können Sie benutzerdefinierte Diagramme und Berichte erstellen, speichern und teilen, z. B. tägliche Betriebszustandszusammenfassungen oder 4xx-Fehlertrends. Der Gesprächsverlauf wird beibehalten, sodass Sie auf früheren Abfragen aufbauen können, ohne den Kontext zu verlieren.

Haben Sie die gewünschten Informationen gefunden?

Ihr Feedback hilft uns, die Qualität der Inhalte auf unseren Seiten zu verbessern.