- Amazon CloudWatch›
- Recursos›
- AIOps
Operações de IA
Aproveite a IA para identificar, diagnosticar e corrigir problemas operacionais rapidamente
Visão geral
Aproveite a ampla experiência operacional que a AWS acumulou e refinou ao longo de 19 anos fornecendo serviços em nuvem para milhões de clientes em todo o mundo. Aplicamos IA e machine learning (ML) para ajudar a aprimorar, acelerar e automatizar os processos de operações em nuvem. O AIOps permite que você observe facilmente suas workloads, acelere a solução de problemas operacionais e tome medidas para resolver e remediar problemas operacionais, melhorando o tempo médio de recuperação (MTTR).
Encontre a causa raiz dos problemas em uma fração do tempo
Inicie uma investigação operacional em qualquer lugar no console de gerenciamento da AWS. É possível configurar o Amazon CloudWatch para iniciar uma investigação logo que um alarme disparar ou criar uma investigação a partir de um chat do Amazon Q. O CloudWatch colabora com você na investigação, auxiliando na identificação de anomalias nas suas aplicações e na formulação de hipóteses sobre a causa raiz dos problemas.
Inicie a demonstração interativa de investigações do CloudWatch
Resolução rápida dos problemas usando sugestões de correção
O Amazon CloudWatch sugere ações corretivas para problemas frequentes da AWS, ao apresentar runbooks do AWS Systems Manager Automation, artigos do AWS re:Post e outras documentações relevantes. Execute o runbook para resolver o problema para que você possa fazer com que seus aplicativos essenciais para os negócios voltem a funcionar totalmente rapidamente.
Leia sobre investigações do Amazon CloudWatch na documentação
Melhore continuamente sua postura operacional
O Amazon CloudWatch usa a IA para criar relatórios abrangentes de análise pós-incidente em minutos. Relatórios de incidentes ajudam você a identificar melhor os padrões, implementar medidas preventivas e melhorar continuamente a postura operacional por meio de análises pós-incidente estruturadas. Reúna e correlacione automaticamente telemetria operacional crítica, configurações de serviços e descobertas de investigação para gerar relatórios detalhados que impulsionam melhorias operacionais.
Saiba mais sobre análise automática de incidentes e relatórios na documentação
Capacite operadores com todos os níveis de experiência
O Amazon CloudWatch assume o trabalho pesado do processo de solução de problemas, para que você não precise ser um especialista em todos os recursos da sua aplicação. Durante uma investigação operacional, o CloudWatch analisa centenas de milhares de pontos de dados para descobrir relações entre serviços e desenvolver uma compreensão de como eles funcionam juntos. Depois de analisar suas descobertas, o CloudWatch apresenta possíveis hipóteses para a causa raiz do problema e orienta você sobre como resolvê-lo.
Detecte anomalias e padrões automaticamente
O Amazon CloudWatch usa machine learning (ML) avançado para definir automaticamente linhas de base e detectar anomalias em seus dados de telemetria, eliminando a necessidade de examinar manualmente suas métricas e logs. Receba alertas sobre picos ou padrões incomuns para resolver os problemas antes que eles se agravem. O CloudWatch destaca padrões recorrentes e valores-chave, como níveis de gravidade, ajudando você a se concentrar rapidamente nos logs relevantes ou comparar o comportamento ao longo do tempo para identificar problemas com mais rapidez.
Leia sobre a detecção de anomalias do CloudWatch na documentação
Consulta de dados de telemetria usando linguagem natural
Extraia insights da telemetria sem precisar aprender linguagens de consulta complexas. Em vez de escrever consultas complexas, você pode simplesmente fazer perguntas em linguagem simples, como “Mostre-me as 10 solicitações mais lentas do AWS Lambda nas últimas 24 horas”, e o Amazon CloudWatch gerará a sintaxe correta automaticamente. Com o recurso de resumo em linguagem natural do CloudWatch Logs Insights, você pode gerar resumos dos resultados da sua consulta para ajudar a identificar problemas rapidamente e obter insights práticos a partir dos seus dados de log.
Leia como você pode usar consultas em linguagem natural e resumos de linguagem natural na documentação
Serviços e soluções em destaque
Clientes
Cedar Gate Technologies
A provedora de tecnologia de saúde Cedar Gate Technologies agora pode identificar a causa raiz dos problemas operacionais em cerca de 30 minutos, em comparação com as duas horas, usando o Amazon CloudWatch para acelerar as investigações e resolver problemas rapidamente para que os clientes continuem fornecendo cuidados valiosos aos seus pacientes.
Amazon Kindle
Os engenheiros de suporte do Amazon Kindle observaram uma resolução de problemas 65% a 80% mais rápida ao utilizar o Amazon CloudWatch para investigações, o que os ajudou a atender mais rapidamente às necessidades dos clientes e proporcionar a melhor experiência ao usuário.
Amazon Music
Os desenvolvedores do Amazon Music estão usando o Amazon CloudWatch como assistente 24 horas por dia, 7 dias por semana, para automatizar investigações e identificar tendências em todos os problemas, ajudando-os a agir mais rapidamente durante seus turnos de plantão. O uso precoce mostra que o Amazon Music está resolvendo problemas duas vezes mais rápido, para que os ouvintes possam continuar curtindo suas músicas favoritas.
SmugMug
A plataforma de gerenciamento de fotos SmugMug usará o Amazon CloudWatch para analisar automaticamente métricas, logs e eventos operacionais em seus sistemas, permitindo que eles diagnostiquem a maioria dos problemas em menos de 20 minutos e até 50% mais rápido. Isso melhora a eficiência operacional ao reduzir as pesquisas manuais de logs, permitindo que sua equipe gaste menos tempo e recursos gerenciando problemas e mais tempo criando a plataforma para ajudar os fotógrafos a expandir suas vitrines digitais.