Rileva e risolvi i problemi in modo efficiente, migliora l'integrità delle applicazioni e offri ai clienti esperienze migliori

Tre segnali fondamentali dell'osservabilità sono metriche, log (dati semi-strutturati) e tracing (flussi di richieste dall'inizio alla fine attraverso tutte le dipendenze). Questi segnali provengono dagli ambienti monitorati, come i container, i microservizi e le applicazioni. L'obiettivo è fornire un'esperienza integrata in modo che i tecnici DevOps e Site Reliability Engineer possano isolare gli eventi critici e utilizzare tutti i segnali di osservabilità per isolare i problemi nelle applicazioni e nei microservizi containerizzati in esecuzione ovunque. Il servizio OpenSearch di Amazon combina le analisi dei log e del tracing in un'unica soluzione.

Introduzione all'osservabilità con il servizio OpenSearch di Amazon su AWS On Air (21:19)

Operazioni di osservabilità

Il servizio OpenSearch di Amazon fornisce nuove funzionalità per risolvere i problemi di osservabilità. Utilizza le interfacce aperte per raccogliere, instradare e trasformare i dati telemetrici (tra cui OpenTelemetry, Fluentd, Fluent Bit, Logstash, Data Prepper e non solo). Puoi cercare e analizzare grandi quantità di dati semi-strutturati con funzionalità native. Puoi inoltre visualizzare, monitorare e inviare avvisi sul rilevamento delle anomalie grazie alle funzionalità di osservabilità dei pannelli di controllo di OpenSearch, oltre a condurre analisi interattive e visualizzare i dati con l'interfaccia di query Piped Processing Language (PPL).

Il servizio OpenSearch di Amazon affronta i problemi di osservabilità, analisi del tracing, analisi dei log e monitoraggio delle prestazioni delle applicazioni in quattro dimensioni:

Raccolta: per prima cosa, devi raccogliere i dati per l'analisi. Il processo include la raccolta, l'arricchimento, il filtraggio, la trasformazione e la normalizzazione dei dati da più origini.

Rilevamento: spesso i clienti non rilevano i problemi con tempestività e c'è sempre un ritardo da quando il problema inizia a quando viene riconosciuto. Devi ridurre questo ritardo il più possibile. Il rilevamento deve essere proattivo e variegato (per esempio con avvisi sulla telemetria). Il rilevamento delle anomalie è uno strumento chiave tanto quanto la capacità di collegare gli allarmi correlati per ridurre il carico del processo. Due elementi fondamentali di questo passaggio sono anche la visualizzazione e il monitoraggio che il servizio OpenSearch di Amazon realizza con un componente chiamato dashboard di OpenSearch. Puoi inoltre analizzare i dati con strumenti come PPL.

Investigazione: questo passaggio è quello che richiede più tempo durante un evento operativo e generalmente l'impegno di più persone. È inoltre il fattore principale del Mean Time to Incident (MTTI) e del Mean Time to Recovery (MTTR). Farsi strada in mezzo al rumore e comprendere dove focalizzarsi è un passaggio molto complicato. Utilizzare i log, le metriche e il tracing ti aiuta a condurre rapidamente la root cause analysis, riuscendo a mettere correttamente in relazione questi tre strumenti su AWS, on-premise o su altri cloud. Puoi collaborare all'investigazione e documentare l'analisi con i notebook delle dashboard di OpenSearch.

Risoluzione: dopo aver identificato la causa del problema, devi rimediare. Non c'è niente di peggio di provare a risolvere un problema e peggiorare ulteriormente la situazione. Non dimenticare di realizzare un'analisi post-evento per determinare il modo in cui avresti potuto prevenire il problema. Prendi nota delle modifiche suggerite per prevenire il problema in futuro. L'obiettivo deve essere quello di assicurarsi che il problema non si ripresenti e, se succede, di saperlo identificare e risolvere in modo automatico.

Come funziona: servizio OpenSearch

Come funziona - servizio OpenSearch

Per l'analisi dei log, ci sono diverse operazioni per creare una pipeline di acquisizione. I dati vengono prodotti da server di backend, servizi AWS, server Web e tanti altri, tra cui OpenTelemetry, AWS Distro per OpenTelemetry, Jaeger e Zipkin. I dati raccolti vengono spostati dalla sorgente, se possibile trasformandoli localmente. Come servizi nativi AWS, puoi utilizzare Amazon Kinesis Agent o l'agente Amazon CloudWatch. Come open source, i più comuni sono Elastic Beats, Fluentd, Fluentbit oppure OpenTelemetry Collector. Gli aggregatori caricano le informazioni degli strumenti di raccolta, che riducono in modo significativo le connessioni al servizio OpenSearch di Amazon. Il servizio OpenSearch di Amazon poi indicizza e analizza il risultato degli aggregatori. Per visualizzare e monitorare i risultati, puoi utilizzare le dashboard di OpenSearch o Kibana.

Monitoraggio delle prestazioni delle applicazioni

A volte il monitoraggio delle prestazioni delle applicazioni (APM) è il primo livello di maturità dell'osservabilità. Ma l'APM da solo non basta. Le prestazioni della tua applicazione sono quelle sperate, anche se la dashboard di monitoraggio dell'applicazione è verde? I clienti ricevono l'esperienza utente che cercano? Qual è l'utilizzo dell'applicazione? Quale parte dell'applicazione tocca i limiti imposti? Da quale area geografica noti la crescita maggiore? Quale tendenza puoi visualizzare e pianificare? Se potessi raccogliere le metriche, avresti la sicurezza, quando sviluppi un nuovo codice o cambi infrastruttura, di vedere l'impatto dei cambiamenti. L'osservabilità aiuta l'APM a rispondere a tutte queste domande.

Clienti

Chase International: esperienza del cliente sempre attiva su larga scala
Dow Jones e 3M: osservabilità grazie al servizio OpenSearch di Amazon

Risorse di osservabilità

Blog e documentazione

Il post sulle novità di AWS


Nuova interfaccia sull'osservabilità e analisi dei log

Il servizio OpenSearch di Amazon ora include un'interfaccia di osservabilità e funzionalità di monitoraggio dei log, che offrono agli sviluppatori e agli ingegneri DevOps le informazioni necessarie per rilevare i problemi delle prestazioni più rapidamente e ridurre i tempi di inattività delle applicazioni.

Blog di AWS sui Big Data


Nozioni di base sulle analisi del tracing

Gli sviluppatori e i team IT Ops possono utilizzare questa funzione per risolvere i problemi di prestazioni e disponibilità nelle loro applicazioni distribuite.

Documentazione AWS


Analisi del tracing per il servizio OpenSearch di Amazon

Scopri come utilizzare l'analisi dei dati di tracing, che fa parte del plugin di osservabilità di OpenSearch, per analizzare i dati del tracing delle applicazioni distribuite.

Caso d'uso sull'osservabilità


Cos'è l'osservabilità?

Scopri come utilizzare Trace Analytics, che fa parte del plugin di osservabilità di OpenSearch, per analizzare i dati del tracing delle applicazioni distribuite.

Articolo sull'osservabilità


Oltre l'efficienza: superare la complessità digitale attraverso l'osservabilità

Le organizzazioni vogliono ottimizzare le prestazioni del sistema, ma perdono le opportunità per farlo. In questo report, scopri come le aziende possono integrare le pratiche di osservabilità per promuovere una maggiore efficienza, fornire approfondimenti sulle minacce alla sicurezza e aumentare la reputazione del marchio.

Workshop

La funzionalità di osservabilità del servizio OpenSearch di Amazon ti permette di andare oltre il semplice monitoraggio per capire non solo quale evento sta accadendo, ma anche la motivazione. In questo workshop, scopriamo come utilizzare, raccogliere e analizzare metriche, dati di tracing e log a partire dal front end fino al backend del servizio, compresi tutti i passaggi intermedi. Metti tutto insieme con il servizio OpenSearch di Amazon, AWS Distro per OpenTelemetry, FluentBit e Data Prepper.

Diagramma architetturale di riferimento AWS

Osservabilità con log, tracce e parametri

Ulteriori informazioni »

Video

Assicura affidabilità e tempi di attività con le soluzioni di osservabilità
Introduzione all'osservabilità con il servizio OpenSearch di Amazon

Podcast

Domande frequenti

D: Che cos'è Trace Analytics?
Trace Analytics è una nuova funzionalità del servizio OpenSearch di Amazon che consente a sviluppatori e operatori IT di individuare e risolvere i problemi di prestazioni nelle applicazioni distribuite, contribuendo a ridurre i tempi di risoluzione dei problemi. Trace Analytics è realizzato utilizzando OpenTelemetry, un progetto della Cloud Native Computing Foundation (CNCF) che fornisce un singolo insieme di API, librerie, agenti e servizi di raccoglitori per acquisire tracce e parametri distribuiti, che consente ai clienti di impiegare Trace Analytics senza la necessità di strumentalizzare nuovamente le proprie applicazioni. Trace Analytics è alimentato da OpenSearch, che è open source e disponibile gratuitamente per il download e l'utilizzo da parte di tutti.

D: Qual è il vantaggio di utilizzare Trace Analytics?
Sviluppatori e operatori IT possono impiegare Trace Analytics per individuare e risolvere i problemi di prestazioni nelle applicazioni distribuite. Aggiungendo dati di traccia alle capacità di analisi dei dati del registro esistente del servizio OpenSearch di Amazon, i clienti possono utilizzare lo stesso servizio sia per isolare la fonte dei problemi di prestazioni, sia per diagnosticarne la causa principale. Inoltre, con il supporto dello standard OpenTelemetry, Trace Analytics supporta l'integrazione con gli SDK Jaeger e Zipkin, due sistemi di tracciatura distribuita open source molto diffusi. Ciò consente agli sviluppatori di continuare a utilizzare questi SDK senza la necessità di una nuova strumentalizzazione delle applicazioni.

D: In che modo Trace Analytics si relaziona e lavora con il servizio OpenSearch di Amazon?
Trace Analytics è una caratteristica integrata del servizio OpenSearch di Amazon. È disponibile gratuitamente per tutti i clienti. Trace Analytics ha un'interfaccia utente basata su Pannelli di Controllo OpenSearch e Kibana per la visualizzazione e l'esplorazione dei dati di traccia ed è integrato con le caratteristiche chiave di Amazon OpenSearch Service come il rilevamento delle anomalie, gli avvisi, il controllo granulare degli accessi e la sicurezza aziendale. Trace Analytics integra l'utilizzo da parte dei clienti di Amazon OpenSearch Service per la ricerca e l'analisi dei dati di registro durante la risoluzione dei problemi di prestazioni dell’applicazione.

D: Quali origini dati supporta Trace Analytics?
Attualmente, Trace Analytics supporta la raccolta di dati di traccia dalle librerie di applicazioni e dagli SDK compatibili con l'OpenTelemetry Collector open source, tra i quali gli SDK Jaeger, Zipkin e X-Ray. Trace Analytics si integra anche con AWS Distro per OpenTelemetry, che è una distribuzione di API, SDK e agenti/raccoglitori OpenTelemetry. Si tratta di una distribuzione performante e sicura di componenti di OpenTelemetry che è stata testata per l'utilizzo in produzione ed è supportata da AWS. I clienti possono utilizzare AWS Distro per OpenTelemetry per raccogliere tracce e parametri per più soluzioni di monitoraggio, inclusi il servizio OpenSearch di Amazon e AWS X-Ray per i dati di traccia e Amazon CloudWatch per i parametri.

D: In che modo è possibile iniziare a utilizzare Trace Analytics?
Per iniziare a utilizzare Trace Analytics, consulta la documentazione disponibile qui.

Ulteriori informazioni sui prezzi del servizio OpenSearch di Amazon
Visita la pagina dei prezzi

Ulteriori informazioni sui prezzi del servizio OpenSearch di Amazon.

Ulteriori informazioni 
Registrati per creare un account gratuito
Registrati per creare un account gratuito

Ottieni l'accesso immediato al piano gratuito di AWS. 

Registrati 
Inizia subito nella console
Tutto pronto per iniziare?

Inizia subito a sviluppare nella Console di gestione AWS.

Inizia