Passa al contenuto principale

AWS DevOps Agent

Promuovi l'eccellenza operativa e previeni gli incidenti in modo proattivo affidandoti a un agente IA autonomo

Perché scegliere AWS DevOps Agent?

AWS DevOps Agent è l'assistente operativo sempre disponibile che risolve e previene in modo proattivo gli incidenti, ottimizza l'affidabilità e le prestazioni delle applicazioni e gestisce attività SRE on demand in ambienti AWS, multi-cloud e on-premises. Analizza gli incidenti e identifica opportunità di miglioramento operativo come un ingegnere DevOps esperto, comprendendo applicazioni e relative dipendenze, utilizzando strumenti di osservabilità, runbook, repository di codice e pipeline CI/CD e correlando dati di telemetria, codice e distribuzione in tutti gli ambienti. Inoltre, permette di fare domande, ottenere risposte immediate e contestuali e creare grafici e report personalizzati da salvare e condividere con il team.

Vantaggi

    L’agente AWS DevOps è il tuo tecnico a chiamata sempre attivo e autonomo. Inizia a indagare nel momento in cui arriva un avviso, alle 2 del mattino o nelle ore di punta, per ripristinare rapidamente l'applicazione alle prestazioni ottimali. L’agente AWS DevOps valuta autonomamente gli incidenti 24 ore su 24, 7 giorni su 7, fornendo analisi delle cause principali e azioni per la risoluzione. Utilizza la sua conoscenza delle risorse e delle relazioni delle applicazioni per comprendere rapidamente le dipendenze e le interazioni. L’agente AWS DevOps semplifica la risposta agli incidenti instradando automaticamente le osservazioni, gli esiti e le fasi di mitigazione attraverso i tuoi canali di comunicazione preferiti come Slack, ServiceNow e PagerDuty.

    AWS DevOps Agent analizza i modelli degli incidenti storici per fornire raccomandazioni utili volte a migliorare quattro aree chiave: osservabilità, ottimizzazione dell'infrastruttura, miglioramento della pipeline di distribuzione e resilienza delle applicazioni. Queste raccomandazioni includono specifiche pronte per l'uso da parte di agenti o colleghi incaricati dell'implementazione di codici applicativi o infrastrutturali. Ciò favorisce un miglioramento continuo senza la necessità di gestire un backlog.

    AWS DevOps Agent permette di accedere alle informazioni non sfruttate dei dati operativi integrandosi in modo sicuro con i flussi di lavoro, gli strumenti di osservabilità, i runbook, i repository di codice e le pipeline CI/CD. AWS DevOps Agent offre integrazioni predefinite con strumenti di osservabilità, come Amazon CloudWatch, Dynatrace, Datadog, New Relic e Splunk, repository di codice e pipeline CI/CD come Azure DevOps, GitHub e GitLab. Puoi estendere AWS DevOps Agent oltre le integrazioni predefinite tramite la connessione sicura ai server MCP, abilitando le integrazioni con strumenti aggiuntivi come strumenti personalizzati dell'organizzazione, piattaforme specializzate o sistemi di ticketing proprietari.

    AWS DevOps Agent sfrutta la profonda conoscenza dell'ambiente, permettendo un'analisi più dettagliata, non limitata alle semplici query, per creare, salvare e condividere grafici e report personalizzati. Puoi eseguire query sull'integrità delle risorse, analizzare i modelli di incidenti, monitorare le distribuzioni e scoprire le raccomandazioni di prevenzione tramite un'interfaccia basata su linguaggio naturale. Inoltre, permette di creare, salvare e condividere grafici e report personalizzati per tenere traccia dei parametri operativi e condividere suggerimenti con il team.

Clienti

United Airlines

"United Airlines trasporta più di 500.000 passeggeri al giorno. L'azienda utilizza circa 38.000 Dynatrace OneAgents per il monitoraggio di un ambiente cloud ibrido, più di 500 account AWS, 20.000 funzioni di AWS Lambda, microservizi Amazon ECS e numerosi altri servizi. In questo contesto, in passato venivano utilizzati più strumenti che eseguivano le stesse funzioni su domini diversi, il che creava lacune e black box durante le attività di risoluzione dei problemi. AWS DevOps Agent con Dynatrace ha cambiato radicalmente questo approccio. Dynatrace rileva i problemi in modo rapido e accurato e identifica il livello applicativo coinvolto. Successivamente, l'agente prosegue l'analisi fornendo passaggi precisi per risolvere il problema, il tutto integrato direttamente in Dynatrace. Non è più necessario segnalare l'incidente con una chiamata alle 3:00 e passare da uno strumento all'altro. Ora le informazioni sono disponibili immediatamente in un unico pannello".

Jason Eckhart, Principal Engineer, Reliability and Observability, United Airlines

Missing alt text value

T-Mobile

"Quando AWS ha introdotto DevOps Agent, T-Mobile ha partecipato al progetto fin dall'inizio. In qualità di design partner, abbiamo potuto osservare in che modo AWS DevOps Agent può migliorare l'analisi della causa principale negli ambienti di produzione. Il feedback reale ha contribuito direttamente all'evoluzione del prodotto. 

La nostra infrastruttura opera su più ambienti cloud e on-premises, con log applicazioni centralizzati nella distribuzione on-premises Splunk. La capacità di integrarsi perfettamente con Splunk e di analizzare i log in ambienti eterogenei di AWS DevOps Agent si è rivelata determinante nel corso della fase di sperimentazione della soluzione".

Aravind Manchireddy, SVP, Technology Operations, T-Mobile

Missing alt text value

Western Governors University

La Western Governors University (WGU), una delle principali università online con oltre 191.000 iscrizioni, è stata tra le prime organizzazioni a distribuire Amazon DevOps Agent in produzione, anche prima del lancio in anteprima durante re:Invent. In qualità di utente Dynatrace su larga scala, WGU sfrutta l'integrazione nativa di Dynatrace di DevOps Agent, permettendo a Dynatrace Intelligence di indirizzare automaticamente i dati dei problemi all'agente per l'indagine e ricevere esiti dettagliati direttamente in Dynatrace.

Nel corso di una recente indagine sulla produzione, il team SRE di WGU ha utilizzato DevOps Agent per analizzare un'interruzione del servizio, riducendo il tempo totale di risoluzione da circa 2 ore a soli 28 minuti, con un miglioramento del 77% del tempio medio di risoluzione (MTTR, Mean Time to Resolution). L'agente ha individuato rapidamente la causa principale all'interno della configurazione di una funzione Lambda, portando alla luce conoscenze operative chiave che in passato erano presenti esclusivamente nella documentazione interna non accessibile.

"In questo modo, è stato possibile fornire la prova decisiva, identificando Lambda come causa del problema. L'indagine ha restituito parametri estremamente accurati e coerenti con quanto osservato frontend". Ha aggiunto: "La giornata di ieri è stata un successo. Se continueremo ad accelerare l'attività di rilevamento, l'impatto sull'organizzazione sarà indescrivibile". WGU intende utilizzare la funzionalità Abilità di DevOps Agent e prevede di ridurre ancora i tempi di indagine.

Angel Marchena, Director of Technical Operations, Western Governors University

Missing alt text value

Zenchef

Zenchef è una piattaforma tecnologica per ristoranti che permette di gestire prenotazioni, attività di sala, menu digitali, pagamenti e operazioni commerciali da un unico sistema senza commissioni. Con un team DevOps dedicato che gestisce diversi ambienti di produzione distribuiti su più unità aziendali, l'azienda ha affrontato una situazione critica durante un hackathon interno: un problema di integrazione dell'API che interessava un partner downstream e che vedeva coinvolto un team di ingegneri, senza evidenze significative e utili nei sistemi di monitoraggio.

Senza interrompere l'attività del team coinvolto nell'evento, l'analisi del problema è stata affidata a DevOps Agent. L'agente ha condotto un'indagine sistematica, escludendo le possibili cause, come l'autenticazione, concentrandosi sulle distribuzioni ECS e individuando la causa principale in una regressione del codice, riconducibile alla mancata gestione di un valore enum non riconosciuto nel database da parte di una nuova versione. L'intera indagine è stata completata in 20-30 minuti, con una riduzione di circa il 75% rispetto alle 1-2 ore necessarie con un approccio manuale. Gli esiti sono stati condivisi direttamente con l'ingegnere responsabile.

"Durante l'hackathon la larghezza di banda era quasi insufficiente per effettuare l'analisi, ma non è stato un limite. Cerchiamo costantemente di anticipare i problemi, ma un livello di indagine proattiva come questo non è sempre possibile. DevOps Agent sta aprendo la strada a nuovi metodi per comprendere il comportamento delle piattaforme".

Theo Massard, Platform Engineering Manager, Zenchef

Missing alt text value

Casi d'uso

Risposta e risoluzione degli incidenti

L’agente AWS DevOps classifica autonomamente gli incidenti e guida i team verso una rapida risoluzione. L’agente AWS DevOps si integra con strumenti di osservabilità, repository di codice e pipeline CI/CD per correlare e analizzare dati di telemetria, codice e implementazione, condividendone ipotesi, osservazioni e esiti. Attraverso indagini sistematiche, l’agente AWS DevOps identifica la causa principale dei problemi derivanti da modifiche al sistema, anomalie di input, limiti di risorse, guasti dei componenti e problemi di dipendenza nell'intero ambiente.

Coordinamento automatico degli incidenti

Puoi avviare e guidare le indagini utilizzando la chat interattiva. L’agente AWS DevOps agisce come membro del tuo team operativo, lavorando direttamente all'interno dei tuoi strumenti di collaborazione come ServiceNow e Slack per condividere gli esiti e coordinare la risposta. Se necessario, crea un caso di Supporto AWS direttamente da un'indagine, fornendo agli esperti del Supporto AWS un contesto immediato per una risoluzione più rapida.

Prevenire futuri incidenti operativi

L’agente AWS DevOps analizza i modelli degli incidenti storici per fornire raccomandazioni attuabili che rafforzano quattro aree chiave: osservabilità, ottimizzazione dell'infrastruttura, miglioramento della pipeline d’implementazione e resilienza delle applicazioni. 

Gestione accelerata delle attività SRE on demand

Ottieni risposte immediate e contestuali alle domande operative senza dover passare da una console all'altra. Puoi eseguire query sull'integrità delle risorse, analizzare i modelli di incidenti, monitorare le distribuzioni e scoprire le raccomandazioni tramite una conversazione in linguaggio naturale. Oltre a domande e risposte, puoi creare, salvare e condividere grafici e report personalizzati, come riepiloghi sullo stato delle operazioni giornaliere o tendenze di errore 4xx. La cronologia delle conversazioni viene mantenuta, permettendo di proseguire l'analisi partendo dalle query precedenti e dal relativo contesto.

Hai trovato quello che cercavi?

Facci sapere la tua opinione in modo da migliorare la qualità dei contenuti delle nostre pagine