Perguntas frequentes sobre o Amazon CloudWatch

Geral

O Amazon CloudWatch é um serviço de monitoramento da AWS para os recursos da nuvem e as aplicações que você executa na AWS. Você pode usar o Amazon CloudWatch para coletar e rastrear métricas, coletar e monitorar arquivos de log e definir alarmes. O Amazon CloudWatch pode monitorar recursos da AWS, como instâncias do Amazon EC2, tabelas do Amazon DynamoDB e instâncias do Amazon RDS DB, além de métricas personalizadas geradas pelas suas aplicações e serviços e quaisquer arquivos de log gerados pelas suas aplicações, hospedados on-premises, híbridos, ou em outras nuvens. Você pode usar o Amazon CloudWatch para obter visibilidade sobre a utilização de recursos, o desempenho de aplicações e o status operacional em todo o sistema. É possível usar essas percepções para reagir e manter seu aplicativo em execução tranquilamente.

Para começar a usar o monitoramento, você pode usar Painéis automáticos com as práticas recomendadas da AWS integradas, explorar a visualização das métricas e alarmes baseados na conta e no recurso, e facilmente fazer uma análise detalhada para entender a causa raiz de problemas de performance.

O Amazon CloudWatch pode ser acessado por meio de API, interface da linha de comando, AWS SDKs e Console de Gerenciamento da AWS.

O Amazon CloudWatch recebe e fornece métricas para todas as instâncias do Amazon EC2 e deve funcionar com qualquer sistema operacional compatível no momento com o serviço Amazon EC2.

O Amazon CloudWatch integra-se com o AWS Identity and Access Management (IAM) para que você possa especificar quais ações do CloudWatch um usuário da sua conta da AWS pode executar. Por exemplo, você pode criar uma política de IAM que oferece a determinados usuários na sua organização permissão para usar o GetMetricStatistics. Eles podem então usar a ação para recuperar dados sobre seus recursos de nuvem.

Não é possível usar o IAM para controlar o acesso a dados do CloudWatch para recursos específicos. Por exemplo, não é possível dar a um usuário acesso a dados do CloudWatch apenas para um conjunto específico de instâncias ou um Load Balancer específico. As permissões concedidas com o IAM abrangem todos os recursos de nuvem que você usa com o CloudWatch. Além disso, você não pode usar funções do IAM com as ferramentas de linha de comando do Amazon CloudWatch.

O Amazon CloudWatch Logs permite que você monitore e solucione problemas em seus sistemas e aplicativos usando arquivos de sistema, aplicativo e log personalizado existentes.

Com o CloudWatch Logs, você pode monitorar seus logs, praticamente em tempo real, para frases, valores e padrões específicos. Por exemplo, você pode definir um alarme sobre o número de erros que ocorrem nos logs do seu sistema ou exibir gráficos de latência de solicitações da web dos logs dos seus aplicativos. Você pode então exibir os dados de log original para ver a origem do problema. Os dados de log podem ser armazenados e acessados indefinidamente em armazenamento resiliente e de baixo custo, assim você não precisa se preocupar com a superlotação de discos rígidos.

O CloudWatch Logs é capaz de monitorar e armazenar seus logs para ajudá-lo a entender e operar melhor seus sistemas e aplicativos. Você pode usar o CloudWatch Logs de diversas maneiras.

Monitoramento de aplicações e sistemas em tempo real: você pode usar o CloudWatch Logs para monitorar aplicações e sistemas usando dados de log. Por exemplo, o CloudWatch Logs pode rastrear o número de erros que ocorrem nos logs da sua aplicação e enviar uma notificação sempre que a taxa de erros exceder um limite especificado por você. O CloudWatch Logs usa seus dados de log para monitoramento, portanto, nenhuma mudança de código é necessária.

Retenção de logs de longa duração: você pode usar o CloudWatch Logs para armazenar dados de logs pelo tempo que precisar em um armazenamento altamente durável e econômico, sem se preocupar com a falta de espaço nos discos rígidos. O CloudWatch Logs Agent facilita a mudança rápida entre arquivos de log rotacionados ou não rotacionados de um host para o serviço de log. Você pode então acessar os dados de evento de log brutos quando precisar.

O CloudWatch Logs Agent é compatível com o Amazon Linux, Ubuntu, CentOS, Red Hat Enterprise Linux e Windows. Esse agente oferece suporte ao monitoramento de arquivos de log individuais no host.

Sim. O CloudWatch Logs Agent está integrado com o Identity and Access Management (IAM) e inclui o suporte tanto às chaves quanto às funções do IAM.

O Amazon CloudWatch Logs Insights é um serviço de análise de logs totalmente integrado, interativo e com modelo de pagamento conforme o uso para o CloudWatch Logs. Ele ajuda desenvolvedores, operadores e engenheiros de sistema a entender, melhorar e depurar seus aplicativos, ao permitir que eles pesquisem e visualizem seus logs. O Logs Insights é totalmente integrado ao CloudWatch, possibilitando que você gerencie, explore e analise seus logs. Você também pode aproveitar as Métricas, Alarmes e Painéis do CloudWatch com logs para obter visibilidade operacional total dos seus aplicativos. Isso permite que você entenda seus aplicativos, faça melhorias e encontre e solucione problemas rapidamente para poder continuar a inovar com rapidez. Você pode escrever consultas com agregações, filtros e expressões regulares para obter percepções práticas dos seus logs. Além disso, você pode visualizar dados temporais, examinar com detalhes eventos de log individuais e exportar resultados de consultas para o CloudWatch Dashboards.

Você pode começar a usar o Logs Insights imediatamente para executar consultas em todos os logs que forem enviados ao CloudWatch Logs. Não são necessárias configurações e não há infraestrutura para gerenciar. Você pode acessar o Logs Insights pelo Console de gerenciamento da AWS ou programaticamente, por seus aplicativos, usando o AWS SDK.

O Amazon CloudWatch Anomaly Detection aplica algoritmos de machine learning para analisar continuamente séries temporais de sistemas e aplicações, determinar uma linha de base normal e anomalias de superfície com intervenção mínima do usuário. E assim permite criar alarmes que ajustam automaticamente os limites com base em padrões métricos naturais, como hora do dia, sazonalidade do dia da semana ou tendências se transformando. Você também pode visualizar métricas com faixas de detecção de anomalias nos painéis, monitorando, isolando e solucionando problemas de alterações inesperadas em suas métricas.

É fácil começar a usar o Anomaly Detection. No console do CloudWatch, acesse Alarmes no painel de navegação para criar um alarme ou comece com Métricas para sobrepor os valores esperados da métrica no gráfico como uma banda. Também é possível habilitar o Anomaly Detection usando os modelos da AWS CLI, de AWS SDKs ou do AWS CloudFormation. Para saber mais, acesse a documentação do CloudWatch Anomaly Detection e a página de preços.

O Amazon CloudWatch agora inclui o Contributor Insights, que analisa dados de séries temporais para fornecer uma visão dos principais colaboradores que influenciam a performance do sistema. Depois de configurado, o Contributor Insights é executado continuamente, sem a necessidade de intervenção adicional do usuário. Isso ajuda desenvolvedores e operadores a isolar, diagnosticar e corrigir problemas mais rapidamente durante um evento operacional.

No console do CloudWatch, vá para o Contributor Insights no painel de navegação para criar uma regra do Contributor Insights. Também é possível habilitar o Contributor Insights usando os modelos de ILC da AWS, SDKs da AWS ou do AWS CloudFormation. O Contributor Insights está disponível em todas as regiões comerciais da AWS. Para saber mais, visite a documentação sobre o Contributor Insights do CloudWatch.

O Amazon CloudWatch ServiceLens é um recurso que permite visualizar e analisar a integridade, a performance e a disponibilidade de aplicações em um único local. O CloudWatch ServiceLens une métricas e logs do CloudWatch, bem como os rastreamentos do AWS X-Ray para fornecer uma visão completa de suas aplicações e dependências. Isso lhe permite identificar rapidamente gargalos de desempenho, isolar as causas raízes dos problemas de aplicativos e determinar os usuários afetados. O CloudWatch ServiceLens lhe permite obter visibilidade sobre seus aplicativos em três áreas principais: monitoramento de infraestrutura (usando métricas e logs para entender os recursos que suportam seus aplicativos) e monitoramento de transações (usando rastreamentos para entender as dependências entre seus recursos) e monitoramento do usuário final (usando canaries para monitorar seus endpoints e notificá-lo quando sua experiência com o usuário final se deteriorar).

Se você já usa o AWS X-Ray, você poderá acessar o CloudWatch ServiceLens no console do CloudWatch por padrão. Se você ainda não usa o AWS X-Ray, você pode começar a usar habilitando-o em seus aplicativos que utilizam a SDK X-Ray. O Amazon CloudWatch ServiceLens está disponível em todas as regiões públicas da AWS em que o AWS-X-Ray está disponível. Para saber mais, visite a documentação sobre o Amazon CloudWatch ServiceLens.

O Amazon CloudWatch Synthetics permite monitorar endpoints de aplicações com mais facilidade. Ele executa testes em seus endpoints a cada minuto, 24 horas por dia e 7 dias por semana, e avisa assim que os endpoints de aplicativos param de se comportar conforme o esperado. Esses testes podem ser personalizados para verificar a disponibilidade, latência, transações, links quebrados ou inoperantes, conclusão de tarefas passo a passo, erros de carregamento da página, latências de carregamento para ativos da IU, fluxos complexos do assistente ou fluxos de checkout em seus aplicativos. Você também pode usar o CloudWatch Synthetics para isolar endpoints de aplicativos em estado de alarme e mapeá-los de volta aos problemas de infraestrutura subjacentes para reduzir o tempo médio de resolução.

É fácil começar a usar o CloudWatch Synthetics. Você pode gravar o seu primeiro canário aprovado em uma questão de minutos. Para saber mais, acesse a documentação do Amazon CloudWatch Synthetics.

Preços

Acesse a nossa página de preços para obter as informações mais recentes.

Todos os tipos de instância do Amazon EC2 automaticamente enviam métricas de integridade e desempenho para o Cloudwatch sem custo. Ao habilitar o monitoramento detalhado do EC2, você será cobrado por métricas personalizadas com base no número de métricas enviadas ao CloudWatch para a instância. O número de métricas enviadas a uma instância está atrelado ao tipo de instância - consulte as Métricas do CloudWatch para suas instâncias disponíveis para obter detalhes.

Salvo indicação em contrário, nossos preços excluem impostos e taxas aplicáveis, incluindo o IVA e o imposto de vendas aplicável. Saiba mais.

Antes de julho de 2017, as cobranças do CloudWatch eram divididas em duas seções diferentes da fatura da AWS e dos relatórios de custo e uso. Por motivos históricos, as cobranças de alarmes do CloudWatch, métricas do CloudWatch e uso da API do CloudWatch eram relacionadas na seção de detalhes “Elastic Compute Cloud” (EC2) da fatura e as cobranças de CloudWatch Logs e CloudWatch Dashboards eram relacionadas na seção de detalhes “CloudWatch”. Para ajudar a consolidar e simplificar o uso e o faturamento mensais do AWS CloudWatch, mudamos as cobranças das métricas, dos alarmes e do uso de API do CloudWatch da seção "EC2" da fatura para a seção "CloudWatch". Dessa forma, todas as cobranças de monitoramento do CloudWatch são exibidas na seção "CloudWatch". Essa mudança não afeta o valor total da fatura da AWS. A fatura e os relatórios de custos e uso passaram simplesmente a exibir as cobranças do CloudWatch em uma única seção.

Além disso, há uma métrica de cobrança no CloudWatch denominada “Estimated Charges”, que pode ser visualizada como a cobrança estimada total ou dividida por serviço. A métrica “Total Estimated Charges” não mudará. No entanto, a métrica “EstimatedCharges” dividida por serviço mudará quando a dimensão ServiceName for “AmazonEC2” ou “AmazonCloudWatch”. Com essa consolidação de faturamento, você poderá observar que a métrica de cobrança AmazonEC2 diminuiu e a métrica de cobrança AmazonCloudWatch aumentou com a mudança do uso e da cobrança do faturamento do EC2 para o CloudWatch.

O preço do Logs Insights é determinado por consulta e cobranças baseadas na quantidade de dados ingeridos examinados pela consulta. Para obter detalhes adicionais sobre a definição de preço, consulte Definição de preço do CloudWatch.

Sim, se você cancelar uma consulta manualmente, será cobrado pela quantidade de dados examinados até o ponto em que cancelou a consulta.

Não, você não é cobrado por queries que falharem.

Observabilidade entre contas

No CloudWatch, a observabilidade entre contas permite que você monitore e solucione problemas de aplicações distribuídas entre várias contas em uma determinada região. Com a observabilidade entre contas, você pode pesquisar, visualizar e analisar de forma integrada métricas, logs e rastreamentos sem se preocupar com os limites das contas. Você pode começar com uma visualização agregada entre contas da sua aplicação para identificar visualmente os recursos que apresentam erros e analisar em detalhes rastreamentos, métricas e logs correlacionados para identificar a causa-raiz do problema. O acesso e a navegação contínuos aos dados entre contas viabilizados pelo monitoramento entre contas ajuda você a reduzir o trabalho manual necessário para solucionar problemas e economizar um tempo valioso na resolução. A observabilidade entre contas é um recurso adicional da funcionalidade de observabilidade unificada do CloudWatch.

A observabilidade entre contas apresenta dois novos conceitos de conta. A “conta de monitoramento” é uma conta da AWS central que pode visualizar e interagir com os dados de observabilidade gerados por outras contas. A “conta de origem” é uma conta da AWS individual que gera os dados de observabilidade para os recursos incluídos nela. Depois que você identificar suas contas de monitoramento e de origem, complete a configuração de monitoramento entre contas com a seleção dos dados de telemetria que serão compartilhados com a conta de monitoramento. Em poucos minutos, você configura facilmente as contas de monitoramento central das quais terá uma visão integral da integridade e da performance das aplicações implantadas nas várias contas relacionadas ou em uma organização inteira da AWS. Com a observabilidade entre contas no CloudWatch, você tem uma visão superior das dependências de todas as suas aplicações, que podem afetar a disponibilidade dos serviços, e pode identificar proativamente e solucionar problemas com um tempo médio de resolução reduzido.

Com a observabilidade entre contas, você pode pesquisar grupos de logs armazenados em várias contas com uma visão central, executar consultas do Logs Insights entre contas, realizar a análise do Live Tail e criar regras do Contributor Insights entre contas para identificar os principais colaboradores N pela geração de entradas de log. Você pode usar a pesquisa de métricas para visualizar as métricas de várias contas de forma consolidada, criar alarmes que avaliam as métricas de outras contas para receber notificações sobre anomalias e problemas em alta e visualizá-los em painéis centralizados. Use esse recurso para configurar um fluxo de métricas único entre contas para incluir métricas que inclua várias contas da AWS em uma região da AWS. Com a observabilidade entre contas, você também pode visualizar um mapa interativo dos aplicativos entre contas usando o ServiceLens com a busca detalhada de etapa única das métricas, dos logs e dos rastreamentos relevantes.

Os dois recursos de monitoramento entre contas no CloudWatch e entre contas/regiões continuam disponíveis no console do CloudWatch. Os menus suspensos entre contas e entre regiões serão removidos do console quando você configurar a observabilidade entre contas no CloudWatch. A experiência de observabilidade entre contas no CloudWatch está disponível em uma região por vez. O recurso entre contas/regiões permite o acesso à telemetria da organização por meio de perfis do IAM. A observabilidade entre contas no CloudWatch usa a API Observability Access Manager para definir as políticas de acesso. Saiba mais em nossa documentação.

Monitoramento de recursos da AWS e de métricas personalizadas

O Amazon CloudWatch permite que você monitore os recursos de nuvem AWS e os aplicativos que executa na AWS. As métricas são fornecidas automaticamente para vários produtos e serviços da AWS, incluindo instâncias do Amazon EC2, volumes do EBS, Elastic Load Balancers, grupos de Auto Scaling, fluxos de trabalho do EMR, instâncias de banco de dados do RDS, tabelas do DynamoDB, clusters do ElastiCache, clusters do RedShift, stacks do OpsWorks, verificações de integridade do Route 53, tópicos do SNS, filas do SQS, fluxos de trabalho do SWF e Storage Gateways. Você também pode monitorar métricas personalizadas geradas por seus próprios aplicativos e serviços.

Você pode publicar e armazenar métricas personalizadas com resolução de um segundo. A retenção estendida de métricas foi lançada em 1 de novembro de 2016, aumentando o período máximo de armazenamento de todas as métricas dos clientes de 14 dias para 15 meses. O CloudWatch retém dados de métricas da seguinte forma:

Pontos de dados com um período inferior a 60 segundos estão disponíveis por 3 horas. Esses pontos de dados são métricas personalizadas de alta resolução.

Os pontos de dados com um período de 60 segundos (1 minuto) estão disponíveis por 15 dias

Os pontos de dados com um período de 300 segundos (5 minutos) estão disponíveis por 63 dias 

Os pontos de dados com um período de 3.600 segundos (1 hora) estão disponíveis por 455 dias (15 meses)

Os pontos de dados publicados inicialmente com um período menor são agregados para armazenamento de longo prazo. Por exemplo, se você coletar dados usando um período de 1 minuto, os dados permanecerão disponíveis por 15 dias com resolução de 1 minuto. Após 15 dias, esses dados continuarão disponíveis, mas serão agregados e poderão ser recuperados apenas com uma resolução de 5 minutos. Após 63 dias, os dados serão agregados novamente e ficarão disponíveis com uma resolução de 1 hora. Se precisar de disponibilidade de métricas durante um período mais longo do que os mencionados acima, você poderá usar a API GetMetricStatistics para recuperar os pontos de dados para um armazenamento distinto ou offline.

No momento, o recurso está disponível nas regiões Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon), Oeste dos EUA (Norte da Califórnia), UE (Irlanda), UE (Frankfurt), América do Sul (São Paulo), Ásia-Pacífico (Cingapura), Ásia-Pacífico (Tóquio), Ásia-Pacífico (Seul), Ásia-Pacífico (Mumbai), Ásia-Pacífico (Sydney), UE (Londres), Canadá (Central), Leste dos EUA (Ohio) e China (Pequim).

A resolução mínima oferecida pelo CloudWatch para os pontos de dados é de um segundo, que é uma métrica de alta resolução. Também é possível armazenar métricas com detalhamento de um minuto. Algumas vezes, as métricas são recebidas pelo CloudWatch a intervalos variáveis, como três ou cinco minutos. Se você não especificar que uma métrica é de alta resolução definindo o campo StorageResolution na solicitação de API PutMetricData, o CloudWatch agregará e armazenará as métricas com a resolução padrão de um minuto.

Dependendo do período de existência dos dados solicitados, as métricas estarão disponíveis nas resoluções definidas nas programações de retenção acima. Por exemplo, se você solicitar dados de um minuto referentes a um dia há 10 dias, receberá 1.440 pontos de dados. No entanto, se você solicitar dados de um minuto de cinco meses atrás, a IU mudará automaticamente o detalhamento para uma hora e a API GetMetricStatistics não retornará nenhuma saída.

O CloudWatch não dá suporte à exclusão de métricas. As métricas expiram com base nas programações de retenção descritas acima.

Sim, o Amazon CloudWatch aceita a consulta de dados de várias fontes, ajudando você a monitorar métricas na AWS, no local e em outras nuvens. Agora você pode solucionar problemas de eventos críticos em minutos, não em horas, e obter visibilidade da integridade da aplicação, apresentando insights mais rapidamente para operações perfeitas. Centralize consultas, visualizações e alarmes de todas as ferramentas de monitoramento em um só lugar.

Não. Você sempre poderá recuperar dados de métricas para qualquer instância do Amazon EC2 com base nas programações de retenção descritas acima. No entanto, o console do CloudWatch limita a pesquisa de métricas para duas semanas após a última ingestão de uma métrica para garantir que as instâncias mais atualizadas sejam exibidas no seu namespace.

Para começar, você navega até o criador de consultas de métricas no console do Amazon CloudWatch e abre o seletor de fontes de dados. O seletor permite que você inicie um assistente para adicionar uma nova fonte de dados de consulta e ativar o alarme. Você escolhe a fonte de dados que deseja consultar e especifica detalhes de acesso, como URL, caminho e credenciais. Consulte a documentação para obter mais detalhes.

Sim. O Amazon CloudWatch armazena métricas de instâncias do Amazon EC2 encerradas ou Elastic Load Balancers excluídos durante 15 meses.

Se você visualizar a mesma janela de tempo em um período de cinco minutos em comparação com um período de um minuto, poderá visualizar que os pontos de dados são exibidos em diferentes locais no gráfico. Para o período especificado no gráfico, o Amazon CloudWatch encontrará todos os pontos de dados disponíveis e calculará um único ponto agregado para representar todo o período. No caso de um período de cinco minutos, o ponto de dados único é posicionado no início da janela de tempo de cinco minutos. No caso de um período de um minuto, o ponto de dados único é posicionado na marca de um minuto. Recomendamos usar um período de um minuto para solucionar problemas e outras atividades que exigem a representação gráfica mais precisa dos períodos.

Você pode usar o Amazon CloudWatch para monitorar dados produzidos por seus próprios aplicativos, scripts e serviços. Uma métrica personalizada é qualquer métrica que você fornece ao Amazon CloudWatch. Por exemplo, você pode usar métricas personalizadas como uma maneira de monitorar o tempo de carga de uma página de web, solicitar taxas de erro, número de processos ou threads na sua instância, ou ainda, a quantidade de trabalho executado por seu aplicativo. Você pode começar a usar as métricas personalizadas usando a API PutMetricData, nossos exemplos de scripts de monitoramento para Windows e Linux, o plugin collectd do CloudWatch, bem como várias aplicações e ferramentas oferecidas por parceiros da AWS.

Uma métrica personalizada pode ter:

Resolução padrão, com dados de granularidade de um minuto

Alta resolução, com dados de detalhamento de um segundo

Por padrão, as métricas são armazenadas com resolução de um minuto no CloudWatch. Você pode definir uma métrica como sendo de alta resolução definindo o parâmetro StorageResolution como 1 na solicitação de API PutMetricData. Se você não definir o parâmetro opcional StorageResolution, o CloudWatch armazenará as métricas com a resolução padrão de um minuto.

Quando você publica uma métrica de alta resolução, ela é armazenada pelo CloudWatch com uma resolução de 10 segundo e pode ser lida e recuperada em períodos de 1, 5, 10, 30 segundos ou qualquer múltiplo de 60 segundos.

As métricas personalizadas seguem a mesma programação de retenção citada acima.

No momento, apenas as métricas personalizadas publicadas no CloudWatch estão disponíveis em alta resolução. As métricas personalizadas de alta resolução são armazenadas no CloudWatch com resolução de um segundo. A alta resolução é definida pelo parâmetro StorageResolution com valor de um na solicitação de API PutMetricData. Esse campo é opcional. Se você não definir um valor para o campo opcional StorageResolution, o CloudWatch armazenará a métrica personalizada com a resolução padrão de um minuto.

Não. As métricas personalizadas de alta resolução têm os mesmos preços que as métricas personalizadas padrão de um minuto.

Você pode monitorar seus próprios dados usando métricas personalizadas, CloudWatch Logs ou ambos. Você poderá preferir usar métricas personalizadas se seus dados não forem produzidos já no formato de log, por exemplo, processos de sistemas operacionais ou medições de performance. Ou, você pode preferir escrever seu próprio aplicativo ou script, ou usar um fornecido por um parceiro da AWS. Se você deseja armazenar ou salvar medições individuais junto com detalhes adicionais, você pode usar o CloudWatch Logs.

Você pode recuperar, representar graficamente e definir alarmes nos seguintes valores estatísticos para as métricas do Amazon CloudWatch: média, soma, mínimo, máximo e contagem de amostras. Estatísticas podem ser calculadas para intervalos de tempo múltiplos de um minuto ou 60 segundos. As estatísticas das métricas personalizadas de alta resolução podem ser calculadas para períodos entre um segundo e três horas.

O Amazon CloudWatch Application Insights para .NET e SQL Server é um recurso que você pode usar para facilmente monitorar seus aplicativos .NET e SQL Server. Ele ajuda a identificar e a configurar as principais métricas e os logs nos recursos de aplicativos e na pilha de tecnologia, como em banco de dados, servidores da web (IIS) e de aplicativos, sistema operacional, balanceadores de carga, filas, etc. Monitorando constantemente esses dados de telemetria, ele detecta e correlaciona anomalias e erros e notifica você sobre quaisquer problemas na aplicação. Para auxiliar a solução de problemas, ele cria painéis automatizados para os problemas de anomalias de métrica e erros de log detectados, além de oferecer insights adicionais que apontam para a possível causa raiz.

Reconhecimento automático de métricas e logs de aplicações: ele verifica os recursos da sua aplicação, fornece uma lista de métricas e logs recomendados para monitorar e os configuram automaticamente, facilitando a configuração do monitoramento de aplicações. 

Detecção de problemas inteligente: ele usa as regras integradas e os algoritmos de machine learning para monitorar e analisar de modo dinâmico os sintomas de um problema em sua pilha de aplicações e detectar problemas nessas aplicações. Ele ajuda a reduzir a sobrecarga de ter que lidar com picos de métrica individuais, ou eventos, ou exceções de log e, em vez disso, é notificado sobre problemas reais, além de obter as informações contextuais desses problemas.

Solução de problemas mais rápida: ele avalia os problemas detectados e fornece insights sobre eles, como a possível causa raiz, e a lista de métricas e logs impactados devido ao problema. Você pode fornecer feedback sobre os insights gerados para tornar o mecanismo de detecção específico para o seu caso de uso.

Aplicação integrada: especifique a aplicação que você deseja monitorar escolhendo o grupo de recursos da AWS associado a ela.

Identificação dos componentes da aplicação: ele analisa os recursos da sua aplicação para identificar os componentes dela (recursos autônomos, ou grupos de recursos relacionados, como grupos do Auto Scaling e grupos de balanceadores de carga). Você também pode personalizar componentes agrupando recursos para obter melhores insights e integração fácil.

Ativação do monitoramento: você pode especificar o nível de tecnologia para os componentes da sua aplicação, ou seja, front-end de IIS, nível do trabalhador do .NET, etc. Baseado em sua seleção, ele fornece um conjunto de métricas e logs recomendados que pode ser personalizado de acordo com suas necessidades. Após salvar esses “monitores”, o Application Insights para .NET e SQL Server configura o CloudWatch para coletá-los em seu nome.

Uma vez integrado, o Application Insights para .NET e SQL Server usa uma combinação de regras integradas e modelos de machine learning para começar a identificar os problemas da aplicação. Ele cria painéis automatizados no CloudWatch com a lista de problemas detectados e uma visualização detalhada desses problemas junto com as anomalias e os erros relacionados.

CloudWatch Metric Streams é um recurso que permite que você transmita continuamente métricas do CloudWatch para um destino de sua escolha com instalação e configuração mínimas. É uma solução totalmente gerenciada e não exige que você escreva nenhum código ou mantenha qualquer infraestrutura. Com alguns cliques, você pode configurar um fluxo de métricas para destinos como o Amazon Simple Storage Service (S3). Você também pode enviar suas métricas para uma seleção de provedores de serviços de terceiros para manter seus painéis operacionais atualizados.

O Metric Streams fornece uma maneira alternativa de obter dados de métricas do CloudWatch sem a necessidade de sondar APIs. Você pode criar um fluxo de métricas com apenas alguns cliques, e seus dados de métricas começarão a fluir para o seu destino. Você pode facilmente direcionar suas métricas para seu data lake na AWS, como no Amazon S3, e começar a analisar o uso ou a performance com ferramentas como o Amazon Athena. O Metrics Streams também facilita o envio de métricas do CloudWatch para provedores de serviços de terceiros populares usando um endpoint HTTP do Amazon Kinesis Data Firehose. Você pode criar uma transmissão contínua e escalável, incluindo os dados de métricas mais atualizados do CloudWatch, para potencializar painéis, alarmes e outras ferramentas que dependem de dados de métricas precisos e oportunos.

Você pode criar e gerenciar o Metric Streams por meio do console do CloudWatch ou de modo programático, por meio da API do CloudWatch, do AWS SDK, da CLI da AWS ou do AWS CloudFormation para provisionar e configurar o Metric Streams. Você também pode usar os modelos do AWS CloudFormation fornecidos por provedores de serviços de terceiros para configurar a entrega do Metric Streams para destinos fora da AWS. Para obter mais informações, consulte a documentação do CloudWatch Metric Streams.

Sim. É possível escolher enviar todas as métricas por padrão ou criar regras de filtro para incluir e excluir grupos de métricas definidas por namespace, por exemplo, AWS/EC2. O Metric Streams detecta automaticamente novas regras de filtro de correspondência de métricas e inclui atualizações de métricas no fluxo. Quando os recursos são encerrados, o Metric Streams para automaticamente de enviar atualizações para as métricas inativas.

O Metric Streams pode produzir no formato OpenTelemetry ou JSON. Você pode selecionar o formato de saída ao criar ou gerenciar fluxos de métricas.

Sim. Você pode visitar a seção de monitoramento da página do console do Metric Streams. Você verá painéis automáticos para o volume de atualizações de métricas ao longo do tempo. Essas métricas também estão disponíveis no namespace da AWS/do CloudWatch e podem ser usadas para criar alarmes para enviar notificações no caso de um aumento incomum no volume.

Monitoramento de logs

O Amazon CloudWatch Logs permite que você monitore e solucione problemas em seus sistemas e aplicativos usando arquivos de sistema, aplicativo e log personalizado existentes.

Com o CloudWatch Logs, você pode monitorar seus logs, praticamente em tempo real, para frases, valores e padrões específicos. Por exemplo, você pode definir um alarme sobre o número de erros que ocorrem nos logs do seu sistema ou exibir gráficos de latência de solicitações da web dos logs dos seus aplicativos. Você pode então exibir os dados de log original para ver a origem do problema. Os dados de log podem ser armazenados e acessados por até dez anos em armazenamento altamente durável e de baixo custo, assim você não precisa se preocupar com a superlotação de discos rígidos.

Os Vended Logs do Amazon CloudWatch são logs publicados de forma nativa pelos serviços da AWS em nome do cliente. Os VPC Flow Logs são o primeiro tipo de Vended Log que se beneficiará desse modelo em níveis. No entanto, outros tipos de log do serviço da AWS serão adicionados aos Vended Logs no futuro.

Consulte Produtos e serviços regionais para obter detalhes sobre a disponibilidade de serviços do CloudWatch Logs por região.

Acesse a nossa página de preços para obter as informações mais recentes.

O CloudWatch Logs é capaz de monitorar e armazenar seus logs para ajudá-lo a entender e operar melhor seus sistemas e aplicativos. Quando você usa o CloudWatch Logs com seus logs, seus dados de log existentes são usados para monitoramento, assim, nenhuma mudança de código é necessária. Aqui estão dois exemplos do que você pode fazer com o Amazon CloudWatch e seus logs:

Monitoramento de aplicativos e sistemas em tempo real. Você pode usar o CloudWatch Logs para monitorar aplicativos e sistemas usando dados de log praticamente em tempo real. Por exemplo, o CloudWatch Logs pode rastrear o número de erros que ocorrem nos logs da sua aplicação e enviar uma notificação sempre que a taxa de erros exceder um limite especificado por você. O Amazon CloudWatch usa seus dados de log para monitoramento e, consequentemente, isso não envolve nenhuma alteração de código da sua parte.

Retenção de log de longa duração: você pode usar o CloudWatch Logs para armazenar os dados de log pelo tempo que precisar em um armazenamento altamente durável e econômico, sem se preocupar com a falta de espaço nos discos rígidos. O CloudWatch Logs Agent facilita a mudança rápida entre arquivos de log rotacionados ou não rotacionados de um host para o serviço de log. Você pode então acessar os dados de evento de log brutos quando precisar.

Você pode configurar o serviço EC2Config para enviar diversos dados e arquivos de log ao CloudWatch, incluindo: logs personalizados no formato texto, logs de eventos (aplicativo, personalizado, segurança, sistema), logs de rastreamento de eventos (ETW) e dados de contador de performance (PCW). Saiba mais sobre o serviço EC2Config aqui.

Por padrão, o CloudWatch Logs Agent envia dados de log a cada cinco segundos e pode ser configurado pelo usuário.

O CloudWatch Logs pode consumir, agregar e monitorar todos os dados de log comum baseados em texto ou no formato JSON.

O CloudWatch Logs Agent registrará um erro caso tenha sido configurado para informar dados de log que não seja texto. Este erro é registrado no arquivo /var/logs/awslogs.log.

Você pode monitorar eventos de log à medida que são enviados para o CloudWatch Logs criando filtros de métrica. Os filtros de métrica transformam dados de log em métricas do Amazon CloudWatch para representações gráficas e alarmes. Os filtros de métrica podem ser criados no console ou na interface de linha de comando (ILC). Os filtros de métrica pesquisam e fazem a correspondência de termos, frases ou valores nos seus eventos de log. Quando um filtro de métrica encontra um dos termos, frases ou valores nos seus eventos de log, ele o contabiliza em uma métrica do Amazon CloudWatch escolhida por você. Por exemplo, você pode criar um filtro de métrica para pesquisar e contabilizar a ocorrência da palavra “Erro” nos seus eventos de log. Os filtros de métrica também podem extrair valores de eventos de log delimitados por espaço, como latência de solicitações da web. Você também pode usar operadores condicionais e curingas para criar correspondências exatas. O console do Amazon CloudWatch pode ajudar você a testar seus padrões antes de criar filtros de métrica.

Um padrão de filtro de métrica pode conter termos de pesquisa ou uma especificação de log comum ou evento JSON.

Por exemplo, se você desejar pesquisar pelo termo Erro, o padrão para o filtro de métrica será simplesmente o termo Erro. Termos de pesquisa múltiplos podem ser incluídos para pesquisar vários termos. Por exemplo, se você quisesse contar os eventos contendo os termos Erro e Exceção, você usaria o padrão Erro Exceção. Para obter uma correspondência exata do termo Exceção de erro, especifique-o entre aspas duplas: “Exceção de erro”. Você pode especificar quantos termos de pesquisa quiser.

O CloudWatch Logs também pode ser usado para extrair valores de um evento de log em logs comuns ou no formato JSON. Por exemplo, você pode rastrear os bytes transferidos dos seus logs de acesso do Apache. Você também pode usar operadores condicionais e caracteres curinga para fazer corresponder e extrair dados em que está interessado. Para usar o recurso de extração dos filtros de métrica, os eventos de log devem ser delimitados por espaço e usar aspas duplas iniciais e finais """ ou colchete inicial "[" e final "]" para estabelecer os campos. Como alternativa, os eventos de log podem ser no formato JSON. Para obter detalhes completos da sintaxe e dos exemplos, leia o Guia do desenvolvedor de filtros de métrica.

O CloudWatch Logs permite que você teste os padrões de filtro de métrica que quiser antes de criar um filtro de métrica. Você pode testar seus padrões em relação aos seus próprios dados de log que já estão no CloudWatch Logs ou pode fornecer seus próprios eventos de log para testar. Testar seu padrão mostra a você quais eventos de log corresponderam ao padrão de filtro de métrica e, caso extraia valores, qual é o valor extraído nos dados de teste. O teste de filtro de métrica está disponível para uso no console e na interface de linha de comando.

Os filtros de métrica do Amazon CloudWatch não dão suporte a expressões regulares. Para processar seus dados de log com expressões regulares, considere usar o Amazon Kinesis e conectar o fluxo com um mecanismo de processamento de expressão regular.

Gerenciamento de logs

Você pode recuperar qualquer um dos seus dados de log usando o console do CloudWatch Logs ou pela ILC do CloudWatch Logs. Os eventos de log são recuperados com base no grupo de logs, fluxo de log e tempo com o qual estão associados. A API do CloudWatch Logs para recuperar eventos de log é a GetLogEvents.

Você pode usar a interface da linha de comando para recuperar seus eventos de log e pesquisar por eles usando o grep ou funções de pesquisa similares na linha de comando.

Você pode armazenar seus dados de log no CloudWatch Logs pelo tempo que quiser. Por padrão, o CloudWatch Logs armazenará seus dados de log indefinidamente. Você pode alterar a retenção para cada grupo de log a qualquer momento.

O Amazon CloudWatch Logs Standard é uma das duas classes de log oferecidas pelo CloudWatch. O Logs Standard oferece gerenciamento abrangente de logs destinado ao monitoramento em tempo real e recursos de análise avançada, como Live Tail, extração de métricas, alarmes e proteção de dados. Você pode monitorar logs praticamente em tempo real para frases, valores e padrões específicos. Por exemplo, você pode definir um alarme sobre o número de erros que ocorrem nos logs do seu sistema ou exibir gráficos de latência de solicitações da web dos logs dos seus aplicativos. Você pode então exibir os dados de log original para ver a origem do problema.

O Amazon CloudWatch Logs Infrequent Access (Logs-IA) é uma das duas classes de log oferecidas pelo CloudWatch. O Logs-IA foi criado especificamente para consolidar todos os logs de forma nativa na AWS. Ele oferece ingestão gerenciada, análise de logs entre contas e criptografia do CloudWatch Logs Standard, com um baixo preço de ingestão por GB. Essa combinação de recursos personalizados e de baixo custo torna o CloudWatch Logs-IA ideal para consultas ad hoc e análises forenses posteriores. Os dados de log podem ser armazenados e acessados indefinidamente em armazenamento resiliente e de baixo custo, assim você não precisa se preocupar com a superlotação de discos rígidos.

O Amazon CloudWatch Logs Infrequent Access (Logs-IA) está disponível em todas as regiões da AWS onde o CloudWatch Logs está disponível. Você pode começar no console ou de maneira programática por meio da AWS CLI ou das APIs.

Análise de log

Para acessar o Logs Insights, sua política de IAM deve incluir permissões para logs:DescribeLogGroups e logs:FilterLogEvents.

Você pode usar o Logs Insights para consultar todos os logs enviados ao Cloudwatch. O Logs Insights automaticamente descobre os campos de logs a partir de logs de serviços da AWS, como CloudTrail, Route53 e VPC Flow Logs; e qualquer log de aplicativo que gere eventos de log em formato JSON. Além disso, para todos os tipos de log, ele gera 3 campos de sistema @message, @logStream e @timestamp para todos os logs enviados ao CloudWatch. o @message contém os dados de evento de log brutos não analisados, o @logStream contém o nome da fonte que gerou o evento de log e o @timestamp contém a hora que o evento de log foi adicionado ao CloudWatch.

O Logs Insights introduz uma nova linguagem de consulta especialmente criada para processamento de logs. A linguagem de consulta oferece suporte a alguns comandos de consulta simples, mas poderosos. Você pode escrever comandos para recuperar um ou mais campos de log, encontrar eventos de log que correspondam a um ou mais critérios de pesquisa, agregar seus dados de log e extrair campos efêmeros dos seus logs baseados em texto. A linguagem de consulta é fácil de aprender e o Logs Insights oferece ajuda no produto na forma de amostras de consultas, descrições de comando e preenchimento automático de consultas para ajudá-lo a começar. Detalhes adicionais sobre a linguagem de consulta podem ser encontrados aqui.

Os service limits são documentados aqui.

O Logs Insights está disponível no Oeste dos EUA (Oregon), Oeste dos EUA (Norte da Califórnia), Leste dos EUA (Ohio), Leste dos EUA (Norte da Virgínia), Ásia-Pacífico (Mumbai), Ásia-Pacífico (Seul), Ásia-Pacífico (Cingapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Tóquio), Canadá (Central), UE (Frankfurt), UE (Irlanda), UE (Londres), UE (Paris), América do Sul (São Paulo).

Você pode escrever consultas contendo agregações, filtros, expressões regulares e pesquisas de texto. Você também pode extrair dados de eventos de log para criar campos efêmeros, que podem ser adicionalmente processados pela linguagem de consulta para ajudar no acesso às informações que você está procurando. A linguagem de consulta é compatível com funções de string. numéricas e matemáticas, como concat, strlen, trim, log e sqrt, entre outras. Você também pode usar expressões boolianas e lógicas, e agregar funções como mín, máx, soma, média e percentil, entre outras. Detalhes adicionais sobre a linguagem de consulta e as funções compatíveis podem ser encontrados aqui.

Você pode encontrar uma lista de comandos de consulta aqui. Você pode encontrar uma lista de funções compatíveis aqui.

Você pode usar visualizações para identificar tendências e padrões que ocorrem ao longo do tempo nos seus logs. O Logs Insights oferece suporte à visualização de dados usando gráficos lineares e gráficos de área empilhada. Ele gera visualizações para todas as consultas que contêm uma ou mais funções agregadas, em que os dados são agrupados ao longo de um intervalo de tempo usando a função bin(). Você pode encontrar detalhes adicionais sobre a visualização de dados de séries temporais aqui.

Você pode usar expressões regulares em Java com o Logs Insights. Expressões regulares podem ser usadas no comando do filtro. Você pode encontrar exemplos de consultas com expressões regulares usando a ajuda no produto ou aqui.

Você pode usar backticks para evitar caracteres especiais. Nomes de campo de arquivos de log que contêm caracteres diferentes dos caracteres alfanuméricos, @ e . precisam ser evitados com backsticks.

Campos de sistema gerados pelo Logs Insights começam com @. O Logs Insights atualmente gera 3 campos de sistema, o @message, que contém os dados de evento de log brutos não analisados enviados ao CloudWatch, o @logStream, que contém o nome da fonte que gerou o evento de log e o @timestamp, que contém a hora que o evento de log foi adicionado ao CloudWatch.

O Logs Insights permite que você consulte dados de logs que foram adicionados ao CloudWatch Logs em 5 de novembro de 2018 ou depois.

Você pode pesquisar eventos de log de um fluxo de logs específico adicionando o filtro de comando de consulta @logStream = "log_stream_name" à sua consulta de log.

O CloudWatch Logs já oferece suporte a opções de integração com outros serviços da AWS, como Amazon Kinesis, Amazon Kinesis Data Firehose, Amazon Elasticsearch e soluções de parceiro ISV da AWS, como Splunk, Sumo Logic e DataDog, entre outras, para fornecer a você opções e flexibilidade em todos os ambientes, para o processamento, enriquecimento, análise e necessidades de visualização personalizadas dos seus logs. Além disso, as capacidades de consulta do CloudWatch Logs Insights estão disponíveis para acesso programático por meio do AWS SDK, para facilitar os parceiros ISV da AWS a criar integrações mais profundas, análises avançadas e valores adicionais no CloudWatch Logs Insights.

As integração de Parceiro ISV com o CloudWatch Logs Insights permite que você leve seus dados de log para um lugar e tenha a capacidade de analisá-los usando as ferramentas e estruturas de sua escolha de uma maneira eficaz e com alto desempenho, sem ter de movimentar volumes muito altos de dados. Você também tem acesso mais rápido aos seus logs ao remover as latências de transferências de dados associadas e pode eliminar as complexidades operacionais de configurar e manter determinadas transferências de dados.

Live Tail no Logs

O Live Tail no Amazon CloudWatch Logs é um novo recurso de análise interativa que fornece uma visão em tempo real dos logs recebidos. Ao usar o Live Tail, você pode solucionar problemas rapidamente: os desenvolvedores podem aproveitar uma visão em streaming de seus logs para depurar seu código, e os engenheiros de TI podem monitorar com segurança o status de suas implantações. O Live Tail oferece uma visão interativa em tempo real dos logs no contexto de eventos relacionados para ajudar a reduzir o tempo médio de detecção e, por sua vez, o tempo médio de resolução.

Você deve usar o recurso interativo do Live Tail no CloudWatch para detecção imediata de problemas de aplicação ou implantação em suas ferramentas nativas de observabilidade da AWS. O Live Tail permite que as equipes de DevOps obtenham uma visibilidade profunda dos logs críticos de suas aplicações e depurem o código de dentro do seu ambiente de desenvolvimento sem precisar alternar entre várias ferramentas. Ao usar o Live Tail para monitorar o status e a integridade das implantações, os engenheiros de TI, o suporte operacional e as equipes de segurança central podem monitorar com eficiência seus serviços e aplicações para agilizar a análise da causa-raiz e reduzir o tempo médio de resolução.

Além de fornecer recursos do Live Tail em logs de aplicações personalizados, o Live Tail também ajuda os clientes a obter informações detalhadas sobre os logs dos serviços da AWS, incluindo Amazon Virtual Private Cloud, Amazon Route53, AWS Lambda, Amazon Elastic Kubernetes Service, Amazon Elastic Container Service e muito mais. Ao usar o widget Live Tail, os serviços da AWS podem incorporar a mesma experiência interativa de transmissão ao vivo em seus consoles. Além disso, a integração direta também pode ser implementada por outros serviços (como Amazon Managed Grafana e AWS Thinkbox) para fornecer a você os mesmos recursos de análise aprofundada de seu próprio console e de qualquer log de aplicação que gere eventos de logs.

Para que esse recurso funcione conforme o esperado, as seguintes operações devem ser permitidas para os usuários. Ao iniciar uma sessão do Live Tail, se você não fizer parte do perfil de administrador ou tiver uma política que inclua logs:*, certifique-se de adicionar as ações abaixo à sua declaração de política: logs:StartLiveTail e logs:StopLiveTail.

Saiba mais sobre os limites de serviço do Live Tail.

Ele está disponível nas seguintes regiões: Leste dos EUA (Ohio), Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Norte da Califórnia), Oeste dos EUA (Oregon), Ásia-Pacífico (Mumbai), Ásia-Pacífico (Seul), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Tóquio), Canadá (Central), UE (Frankfurt), UE (Irlanda), UE (Londres), UE (Paris) e América do Sul (São Paulo).

Você pode filtrar com base em grupos de logs, fluxos de logs e por palavras-chave. A seleção de grupos de logs é compatível com várias seleções em diversas contas quando na conta de monitoramento (observabilidade entre contas). A seleção de fluxos de logs é compatível com várias seleções com base no nome ou em um prefixo. Filtrar por palavras-chave diferencia maiúsculas de minúsculas. Uma ou mais palavras-chave (por exemplo, erro, exceção ou falha) podem ser inseridas para restringir ainda mais o foco da pesquisa. Você pode digitar as palavras-chave ou copiar e colar as amostras fornecidas no painel Informações. Saiba mais sobre padrões de filtro.

Não, o Live Tail fornece uma visualização em tempo real dos dados de logs coletados pelo CloudWatch. Para logs históricos, consulte os recursos Logs Insights e de grupos de logs.

Proteção de dados de logs

A proteção de dados é um recurso no CloudWatch Logs que permite definir regras e políticas próprias para detectar e mascarar automaticamente os dados confidenciais nos logs coletados de sistemas e aplicações. Esse procedimento é feito por machine learning (ML) e correspondência de padrões. É possível visualizar os dados sem mascaramento com privilégios elevados do Identity and Access Management (IAM).

Para impedir o registro em log de dados confidenciais, os clientes às vezes recorrem à investigação manual ou configuram políticas de retenção de logs de curto prazo para excluir os logs, correndo o risco de perder logs operacionais importantes. A proteção de dados do CloudWatch Logs identifica e mascara automaticamente as informações confidenciais em seus logs usando a correspondência de padrões e o ML, sem que ninguém precise acessá-los. Esse recurso é útil em setores com regulamentos rigorosos que precisam garantir que nenhuma informação pessoal seja armazenada. Além disso, os clientes que desenvolvem serviços de pagamento ou de autenticação, em que muitas informações pessoais e confidenciais são necessárias, podem usar esse novo recurso para reduzir a probabilidade de armazenamento de informações sem necessidade em seus logs.

Quando você cria a política de proteção de dados no CloudWatch Logs, pode especificar aqueles que deseja proteger. Há vários identificadores de dados à sua escolha, como e-mails, carteiras de habilitação de diversos países, números de cartão de crédito, endereços etc. Essa variedade de identificadores de dados segmentados oferece flexibilidade para escolher quais dados confidenciais serão usados em suas aplicações e para mascarar os dados sigilosos que não precisam de acesso fácil. É importante que você decida as informações que são confidenciais em sua aplicação e selecione os identificadores relevantes aos seus casos de uso.

alarmes

Você pode criar um alarme para monitorar qualquer métrica do Amazon CloudWatch na sua conta. Por exemplo, você pode criar alertas em uma utilização de CPU de instância do Amazon EC2, latência de solicitação do Amazon ELB, taxa de transferência de tabelas do Amazon DynamoDB, comprimento de fila do Amazon SQS ou mesmo as cobranças da sua conta da AWS.

Também é possível criar um alarme para métricas personalizadas específicas de aplicativos ou infraestrutura personalizados. Se a métrica personalizada tiver alta resolução, você poderá criar alertas de alta resolução, emitidos para períodos de 10 ou 30 segundos.

Já para alarmes compostos, é possível combinar vários alarmes em hierarquias de alarme. Isso reduz o ruído do alarme ao permitir o acionamento somente mediante a ativação de vários alarmes ao mesmo tempo. Você pode fornecer um estado geral para um agrupamento de recursos como uma aplicação, região da AWS ou zona de disponibilidade.

Consulte a página de preços do CloudWatch para saber mais.

Ao criar um alarme, é possível configurá-lo para executar uma ou mais ações automáticas quando a métrica escolhida para monitoramento exceder um limite definido por você. Por exemplo, você pode definir um alarme que envia um e-mail, publica na fila do SQS, para ou encerra uma instância do Amazon EC2, ou executa uma política de Auto Scaling. Como os alarmes do Amazon CloudWatch são integrados ao Amazon Simple Notification Service, também é possível usar qualquer tipo de notificação compatível com o SNS. Você pode usar a ação do AWS Systems Manager OpsCenter para criar automaticamente um OpsItem quando o alarme entrar no estado ALARM. Isso ajuda a diagnosticar e corrigir rapidamente problemas nos recursos da AWS em um único console.

Quando você cria um alarme, escolhe primeiro a métrica do Amazon CloudWatch que deseja monitorar. Em seguida, você escolhe o período de avaliação (por exemplo, cinco minutos ou uma hora) e um valor estatístico para medir (por exemplo, médio ou máximo). Para definir um limite, defina um valor de destino e escolhera se o alerta dispara quando o valor for maior que (>), maior ou igual a (>=), menor que (<) ou menor ou igual a (<=) esse valor.

Os alarmes continuam a avaliar as métricas em relação ao limite escolhido, mesmo depois do acionamento. Isso permite que você visualize este estado atualizado o tempo todo. Você pode observar que um dos seus alarmes fica no estado ALARME por um longo período. Se seu valor de métrica ainda estiver violando seu limite, o alarme permanecerá no estado ALARME até que não mais viole esse limite. Esse comportamento é normal. Se você quiser que seu alerta trate este novo nível como OK, você poderá ajustar o limite do alerta para responder desta maneira.

O histórico de alarmes fica disponível por 14 dias. Para visualizar seu histórico de alarmes, faça login no CloudWatch pelo Console de Gerenciamento da AWS, escolha Alarms no menu à esquerda, selecione seu alarme e clique na guia History no painel inferior. Lá você encontra um histórico de qualquer alteração de estado dos alertas, além de qualquer modificação feita à configuração do alerta.

Painéis

O Amazon CloudWatch Dashboards permite criar, personalizar, interagir e salvar gráficos de recursos e métricas personalizadas da AWS.

Para começar a usar, acesse o Console do Amazon CloudWatch e selecione “Dashboards”. Clique no botão "Criar painel". Você também pode copiar a visualização desejada do Automatic Dashboards clicando em Opções -> “Adicionar ao Dashboard”.

Os Automatic Dashboards são integrados às práticas recomendadas do serviço da AWS, permanecem baseados em recursos e são dinamicamente atualizados para refletir o estado mais recente das métricas importantes de desempenho. Agora, você pode filtrar e solucionar problemas para uma visualização específica sem necessidade de código adicional para refletir o estado mais recente dos recursos da AWS. Depois que você tiver identificado a causa raiz de um problema de performance, poderá tomar medidas imediatas acessando diretamente o recurso da AWS.

Sim. Os painéis serão atualizados automaticamente enquanto você estiver abrindo-os.

Sim, os painéis estão disponíveis para qualquer pessoa com as permissões certas para a conta do painel.

Eventos

O Amazon CloudWatch Events (CWE) é um fluxo de eventos do sistema descrevendo alterações nos seus recursos da AWS. O fluxo de eventos aumenta os fluxos do CloudWatch Metrics e Logs para fornecer uma imagem mais completa da integridade e do estado dos seus aplicativos. Você escreve regras declarativas para associar eventos de interesse com ações automáticas a serem adotadas.

No momento, Amazon EC2, Auto Scaling e AWS CloudTrail são compatíveis. Através do AWS CloudTrail, chamadas de API em mutação (ou seja, chamadas exceto Describe*, List* e Get*) em todos os serviços são visíveis no CloudWatch Events.

Quando um evento corresponde a uma regra criada no sistema, você pode chamar automaticamente uma função do AWS Lambda, passar o evento para um stream do Amazon Kinesis, notificar um tópico do Amazon SNS ou chamar um fluxo de trabalho incorporado.

Sim. Seus aplicativos podem emitir eventos personalizados usando a API PutEvents, com uma carga exclusivamente adequada às suas necessidades.

O CloudWatch Events é capaz de gerar eventos em um horário definido por você usando a sintaxe cron Unix conhecida. Monitorando esses eventos, você pode implementar uma aplicação programada.

O CloudWatch Events é um fluxo praticamente em tempo real de eventos do sistema que descreve as alterações aos seus recursos da AWS. Com o CloudWatch, você pode definir regras para monitorar eventos específicos e executar ações de maneira automática. O AWS CloudTrail é um serviço que registra chamadas de API para a sua conta da AWS e entrega arquivos de log contendo chamadas de API para seu bucket do Amazon S3 ou um grupo de log do CloudWatch Logs. Com o AWS CloudTrail, você pode consultar o histórico de atividades da API relacionadas à criação, exclusão e modificação de recursos da AWS e solucionar problemas operacionais e de segurança.

O AWS Config é um serviço totalmente gerenciado que oferece inventário de recursos, histórico de configuração e notificações de alteração de configuração da AWS para proporcionar segurança e governança. O Config Rules ajuda você a determinar se as alterações de configuração são compatíveis. O CloudWatch Events foi criado para reagir praticamente em tempo real a alterações feitas no estado de recursos. Ele não oferece uma decisão quanto à conformidade das alterações com políticas ou fornece histórico detalhado como o Config/Config Rules faz. É um stream de eventos de propósito geral.

Monitoramento de contêineres

O CloudWatch Container Insights é um recurso para monitorar, solucionar problemas e emitir alarmes em aplicativos e microsserviços conteinerizados. O Container Insights simplifica o isolamento e a análise de problemas de performance que afetam um ambiente de contêineres. Engenheiros de DevOps e sistemas têm acesso a painéis automáticos no console do CloudWatch, o que os proporciona visibilidade operacional completa de métricas, logs e rastreamentos distribuídos que resumem a performance e a integridade de seus clusters do Amazon Elastic Container Service for Kubernetes (EKS), Amazon Elastic Container Service (ECS), AWS Fargate e Kubernetes por pods/tarefas, contêineres e serviços.

O Container Insights com observabilidade aprimorada para o Amazon Elastic Kubernetes Service (EKS) permite que você detalhe visualmente as camadas do contêiner EKS e identifique com facilidade problemas como vazamentos de memória em contêineres individuais, reduzindo o tempo médio de resolução. Com as métricas do ambiente de gerenciamento, você já pode monitorar o status da escalabilidade automática e planejar os ciclos de vida de clusters de teste nos recursos de teste automatizados para melhorar a eficiência operacional. Agora, com a observabilidade aprimorada para EKS, você pode classificar clusters, nós e workloads por consumo de recursos e identificar rapidamente anomalias, configurar seus próprios alarmes para um monitoramento mais rigoroso e mitigar os riscos de forma proativa antes que a experiência do usuário final seja afetada.

Sim. Usando o Container Insights com observabilidade aprimorada para o Amazon Elastic Kubernetes Service (EKS), você pode monitorar o status do ambiente de gerenciamento. É possível usá-lo para entender o status do escalonamento automático e planejar os ciclos de vida do cluster de teste nos recursos de teste automatizados, por exemplo.

O Container Insights com observabilidade aprimorada para o Amazon Elastic Kubernetes Service (EKS) oferece métricas detalhadas de integridade e performance prontas para uso, incluindo métricas de performance do EKS no nível de contêiner, métricas do Kube-state e métricas do ambiente de gerenciamento do EKS para agilizar o isolamento e a resolução de problemas. A observabilidade aprimorada permite que os clientes detalhem visualmente várias camadas de contêineres e identifiquem facilmente problemas como vazamentos de memória em contêineres individuais, reduzindo o tempo médio de resolução. Com as métricas do ambiente de gerenciamento, os clientes já podem monitorar o status da escalabilidade automática e planejar os ciclos de vida de clusters de teste nos recursos de teste automatizados para melhorar a eficiência operacional. Agora, com a observabilidade aprimorada, os clientes podem classificar clusters, nós e workloads por consumo de recursos e identificar rapidamente anomalias, configurar seus próprios alarmes para um monitoramento mais rigoroso e mitigar os riscos de forma proativa antes que a experiência do usuário final seja afetada. A observabilidade aprimorada é um recurso opcional. O Container Insights sem observabilidade aprimorada fornece métricas agregadas em nível de cluster e serviço.

Sim. Você pode usar o Container Insights com ou sem observabilidade aprimorada por cluster. Você pode habilitar a observabilidade aprimorada dos clusters instalando o complemento CloudWatch Observability para EKS nos clusters depois que eles forem criados usando a guia complementos na visualização de informações do cluster. Consulte a documentação do CloudWatch Container Insights sobre como configurar o agente do CloudWatch para permitir uma observabilidade melhor para o EKS.

O Container Insights com observabilidade aprimorada é compatível com o Amazon EKS.

Você pode começar a coletar métricas de performance, logs e metadados detalhados de seus contêineres e clusters ou habilitar seu complemento do CloudWatch Observability para melhorar a observabilidade com apenas alguns cliques. Para começar a usar o Container Insights, siga as etapas fornecidas na documentação do Amazon CloudWatch Container Insights.

Detalhes adicionais de preço do Container Insights estão disponíveis na página de preços do CloudWatch.

Não. Os tipos de métricas atuais compatíveis são Medidor e Contadores. As métricas Histograma e Resumo estão planejadas para um lançamento futuro.

Prometheus é um projeto de monitoramento popular de código aberto, que faz parte da Cloud Native Compute Foundation (CNCF). A comunidade de código aberto desenvolveu mais de 150 plug-ins e uma estrutura personalizada que as equipes de DevOps podem usar para expor métricas personalizadas a serem coletadas com o uso de uma abordagem baseada em pull em seus aplicativos. Com esse novo recurso, equipes de DevOps podem automaticamente detectar serviços para workloads conteinerizadas, como AWS App Mesh, NGINX e Java/JMX. Elas podem, portanto, expor métricas personalizadas desses serviços e inseri-las no CloudWatch. A curadoria da coleção e da agregação de métricas do Prometheus permite que os usuários do CloudWatch monitorem, solucionem problemas e emitam alarme sobre falhas e degradação da performance dos aplicativos mais rapidamente, e ainda reduz o número de ferramentas de monitoramento necessárias.

As métricas do Prometheus são automaticamente ingeridas como métricas personalizadas do CloudWatch. O período de retenção é de 15 meses por ponto de dados de métrica com compilação automática (< 60 segundos disponível por 3 horas, 1 minuto disponível por 15 dias, 5 minutos disponível por 63 dias, 1 hora disponível por 15 meses). Para saber mais, consulte a documentação sobre a retenção de métricas do CloudWatch.

Não. Todas as métricas são ingeridas como eventos do CloudWatch Logs e podem ser consultadas por meio de consultas do CloudWatch Logs Insights. Para obter mais informações, consulte a documentação sobre a sintaxe de linguagem de pesquisa do CloudWatch Logs Insights.

Sim. Cada cluster do Kubernetes (k8s) tem seu próprio grupo de logs para os eventos (por exemplo, /aws/containerinsights//prometheus) com seu próprio período de retenção configurável. Para obter mais detalhes, consulte a documentação sobre retenção de grupos de logs.

Você será cobrado pelo que usar, da seguinte maneira: (1) CloudWatch Logs ingeridos por gigabyte (GB), (2) CloudWatch Logs armazenados e (3) Métricas personalizadas do CloudWatch. Consulte a página de preços do CloudWatch para obter os detalhes de preços na sua região da AWS.

Monitoramento da Internet

O Monitor de Internet do Amazon CloudWatch ajuda você a monitorar continuamente as métricas de disponibilidade e performance da Internet entre aplicações hospedadas na AWS e os usuários deles. Com o Monitor de Internet você pode visualizar rapidamente o impacto de problemas e identificar localizações e provedores afetados e tomar medidas para aprimorar a experiência de rede dos usuários finais. Você tem uma visualização global dos padrões de tráfego e dos eventos de integridade e pode obter informações detalhadas sobre os eventos com diferentes níveis de granularidade da área geográfica. Se um problema for causado pela rede da AWS, você receberá uma notificação no AWS Health Dashboard informando as medidas tomadas pela AWS para mitigar o problema. O Monitor de Internet também fornece insights e recomendações que podem ajudar a melhorar a experiência dos usuários usando outros serviços da AWS.

Para usar o Monitor de Internet, crie um monitor e associe os recursos do aplicativo a ele, às nuvens virtuais privadas (VPCs), às distribuições do CloudFront ou aos diretórios do WorkSpaces, para habilitar o Monitor de Internet onde o tráfego da Internet do seu aplicativo estiver. O Monitor de Internet então fornece as avaliações da Internet geradas pela AWS que forem específicas aos locais e redes que comunicam com o seu aplicativo.

Você então pode usar o painel do CloudWatch para conhecer os eventos de integridade, exibir a pontuação de performance e disponibilidade, explorar os dados históricos do aplicativo com detalhes geográficos diferentes e obter insights sobre como configurar o aplicativo para aprimorar a performance para seus usuários finais.

O Monitor de Internet publica as avaliações da Internet para o CloudWatch Logs e CloudWatch Metrics, para que você possa facilmente usar as ferramentas do CloudWatch para entender melhor a integridade do aplicativo em geografias e redes específicas a ele. O Monitor de Internet também envia eventos de integridade para o Amazon EventBridge, para que você possa configurar as notificações.

À medida que você explora o Monitor de Internet, convém se familiarizar com os componentes e conceitos que são mencionados no serviço. O Monitor de Internet usa ou menciona os seguintes termos: monitor, logs do CloudWatch, métricas do CloudWatch, redes urbanas, eventos de integridade, números de sistema autônomo (ASNs), recurso monitorado, avaliações da Internet, tempo do percurso, bytes transferidos e pontuações de disponibilidade e performance.

Leia uma descrição rápida desses componentes na documentação.

O preço do Monitor de Internet inclui os seguintes componentes: uma taxa por recurso monitorado, uma taxa por rede urbana e cobranças pelos logs de diagnóstico publicados no CloudWatch Logs. Para obter mais informações, acesse a página de preços do Monitor de Internet do Amazon CloudWatch.

No Monitor de Internet, o suporte regional depende dos tipos de recursos que você adiciona ao seu monitor. Para as distribuições do Amazon CloudFront e diretórios do Amazon WorkSpaces, o Monitor de Internet está disponível em todas as regiões com suporte. Para as nuvens privadas virtuais (VPCs) da Amazon, é possível adicionar VPCs de uma região opcional somente a um monitor criado na mesma região. Para obter uma lista completa das regiões da AWS com suporte, consulte Endpoints do Monitor de Internet do Amazon CloudWatch.

Monitoramento do Lambda

O CloudWatch Lambda Insights é um recurso para monitorar, solucionar problemas e otimizar o desempenho e o custo das funções do Lambda. O Lambda Insights simplifica o isolamento e a análise de problemas de performance que afetam um ambiente Lambda. DevOps e engenheiros de sistemas têm acesso a painéis automáticos no console do CloudWatch, o que lhes dá visibilidade operacional de ponta a ponta das métricas, dos logs e dos rastreamentos com um resumo da performance e da integridade de suas funções do AWS Lambda.

Você pode começar a coletar métricas detalhadas de performance, logs e metadados de suas funções do Lambda seguindo estas etapas na documentação do CloudWatch Lambda Insights.

O CloudWatch Lambda Insights coleta automaticamente métricas personalizadas de eventos de desempenho ingeridos como do CloudWatch Logs de suas funções do Lambda. Detalhes adicionais de preço estão disponíveis na página de preços do CloudWatch.

Monitoramento de experiência digital

O Amazon CloudWatch DEM permite monitorar como os usuários finais experimentam suas aplicações (incluindo performance, disponibilidade e usabilidade). 

Identifique problemas intermitentes, seja notificado mesmo quando não houver tráfego de usuário e monitore seus endpoints e UI usando canários CloudWatch Synthetic. Complemente o monitoramento sintético com CloudWatch RUM para entender o impacto do usuário final e obter melhor visibilidade de sua experiência digital. Com o CloudWatch Evidently, melhore a experiência digital do usuário final experimentando e validando novos designs e recursos. 

O Amazon CloudWatch RUM é um recurso real de monitoramento de usuário que oferece visibilidade da performance do lado do cliente de uma aplicação para ajudar a reduzir o “Mean Time to Resolution” (MTTR – Tempo médio de resolução). Com o CloudWatch RUM, você pode coletar dados do lado do cliente sobre a performance de aplicações Web em tempo real para identificar e depurar problemas. Ele complementa os dados do CloudWatch Synthetics para dar a você mais visibilidade da experiência digital do usuário final. Você pode visualizar anomalias na performance e usar os dados de depuração relevantes (como mensagens de erro, rastreamentos de pilha e sessões de usuário) para corrigir problemas de performance (como erros de JavaScript, falhas latências). Você também pode compreender a gama de impactos ao usuário final, incluindo o número de sessões, geolocalização ou navegadores. O CloudWatch RUM agrega dados sobre a jornada de seus usuários por meio da aplicação, o que pode ajudar a determinar quais recursos iniciar e correções de erros a priorizar.

Crie um monitor de aplicação no CloudWatch RUM e adicione o cliente Web leve no cabeçalho HTML de sua aplicação. Em seguida, comece a usar os painéis do CloudWatch RUM para receber percepções do usuário de diferentes geolocalização, dispositivos, plataformas e navegadores. 

O Amazon CloudWatch Evidently permite que você conduza experimentos e identifique consequências indesejadas de novos recursos antes de implementá-los para uso geral, reduzindo assim o risco relacionado a lançamentos de novos recursos. Evidentemente, permite que você valide novos recursos em toda a pilha de aplicações antes do lançamento, o que torna o lançamento mais seguro. Ao lançar novos recursos, você pode expô-los a uma base de usuários menor, monitorar as principais métricas, como tempos de carregamento de página ou conversões, e então acessar o tráfego discado. O Evidently também permite que os desenvolvedores experimentem designs diferentes, coletem dados do usuário e liberem o design mais eficaz em produção. Ele ajuda você a interpretar e agir sobre os resultados do experimento sem a necessidade de conhecimentos estatísticos avançados. Você pode usar os insights fornecidos pelo mecanismo estatístico do Evidently (como valor p a qualquer momento e intervalos de confiança) para tomar decisões enquanto um experimento está em andamento.

Você pode usar o fragmento de código CloudWatch RUM JavaScript para coletar jornadas do usuário do lado do cliente e métricas de performance. Se desejar, você também pode adicionar métricas personalizadas como conversões usando a API Evidently. Em seguida, novos recursos a serem testados podem ser instrumentados com o CloudWatch Evidently SDK, que fornece a capacidade de controlar como os usuários são expostos aos novos recursos. Agora você pode executar lançamentos e experimentos, usando o console AWS ou CLI. 

O Amazon CloudWatch Synthetics permite monitorar endpoints de aplicações com mais facilidade. Ele executa testes em seus endpoints a cada minuto, 24 horas por dia e 7 dias por semana, e avisa assim que os endpoints de aplicativos param de se comportar conforme o esperado. Esses testes podem ser personalizados para verificar a disponibilidade, latência, transações, links quebrados ou inoperantes, conclusão de tarefas passo a passo, erros de carregamento da página, latências de carregamento para ativos da IU, fluxos complexos do assistente ou fluxos de checkout em seus aplicativos. Você também pode usar o CloudWatch Synthetics para isolar endpoints de aplicativos em estado de alarme e mapeá-los de volta aos problemas de infraestrutura subjacentes para reduzir o tempo médio de resolução.

É fácil começar a usar o CloudWatch Synthetics. Você pode gravar o seu primeiro canário aprovado em uma questão de minutos. Para saber mais, acesse a documentação do Amazon CloudWatch Synthetics.

Os dois serviços podem ser usados separadamente, mas são ainda melhores juntos.

AppConfig é um recurso do AWS Systems Manager que você pode usar para criar, gerenciar e implantar sinalizadores de recursos e outras configurações de aplicações. Ao desenvolver novos recursos, você pode usar o AppConfig para implantar um novo recurso na produção, mas ocultá-lo atrás de um sinalizador. Quando estiver pronto para iniciar, basta atualizar sua configuração para lançar o recurso de forma instantânea ou gradual.

Para gerenciamento e experimentação de recursos mais avançados, você pode usar o Evidently, que é um novo recurso do Amazon CloudWatch. Com o Evidently, você pode executar experimentos em diferentes variações de recursos e compará-los com uma linha de base, ou lançar uma variação de recursos em uma programação, enquanto monitora métricas de negócios como duração da visita e receita. O Evidently também se integra ao CloudWatch RUM, que fornece monitoramento de performance de aplicações do lado do cliente para que as métricas do RUM possam ser usadas diretamente no Evidently.

Análise de métricas

O CloudWatch Metrics Insights é um mecanismo de consulta de alta performance que ajuda você a dividir e separar suas métricas operacionais em tempo real e criar agregações instantâneas usando consultas SQL padrão. O Metrics Insights ajuda você a entender o status da integridade e da performance de sua aplicação porque é possível analisar suas métricas em grande escala. Ele é integrado ao CloudWatch Dashboards para que você possa salvar consultas nos painéis de integridade e performance para monitorar de forma proativa e localizar problemas rapidamente.

Para começar, basta clicar na guia Metrics (Métricas) em seu console do CloudWatch, e você encontrará o Metrics Insights como um mecanismo de consulta integrado na guia Query (Consulta) sem nenhum custo adicional. Embora o Metrics Insights venha com a linguagem SQL padrão, você também pode começar a usar o Metrics Insights utilizando o construtor de consulta visual. Para usar o construtor de consultas, selecione as métricas desejadas, os namespaces e as dimensões visualmente, e o console constrói automaticamente as consultas SQL para você, com base em suas seleções. Você pode usar o editor de consulta para digitar suas consultas SQL brutas a qualquer momento a fim de se aprofundar e identificar problemas para obter informações mais detalhadas. O Metrics Insights também vem com um conjunto de consultas de amostra prontas para uso que podem ajudar a começar a monitorar e investigar a performance de sua aplicação instantaneamente. O Metrics Insights também está disponível de maneira programática por meio do CloudFormation, do AWS SDK e da CLI.