Amazon Web Services ブログ

Tag: Monitoring

Best Practices for Deploying AWS DevOps Agent in Production

AWS DevOps Agent を本番環境にデプロイするためのベストプラクティス

インシデント発生時の根本原因分析は、クラウド運用において最も時間がかかる作業の一つです。AWS DevOps Agent は、自律的な調査能力により平均復旧時間 (MTTR) を数時間から数分に短縮します。本記事では、調査能力と運用効率のバランスを取る Agent Space のセットアップに関するベストプラクティスを紹介します。最適な調査精度を実現するための Agent Space の構成方法、適切なリソースアクセス範囲の決定方法、そして Infrastructure as Code を活用したデプロイの効率化について解説します。

SAP on AWSのエンドツーエンド・オブザーバビリティ: Part-3 Amazon CloudWatch Internet Monitor for SAP

Amazon CloudWatch Internet Monitor for SAP Applications は、インターネット接続に関するリアルタイムのインサイトを提供し、企業が問題をトラブルシューティングし、ネットワークパフォーマンスを最適化するのを支援します。

Amazon CloudWatch Logs の一元化を使用したログ管理の簡素化

複数の AWS アカウントとリージョンにまたがるログの管理は、組織にとって常に複雑な課題でした。本番環境、開発環境、ステージング環境用の個別のアカウントやリージョンを含む AWS インフラストラクチャーが成長するにつれ、ログ管理の複雑さは指数関数的に増加します。特に時間外の重大なインシデント発生時には、チームは複数のアカウントを検索し、異なるリージョン間でイベントを関連付け、複雑なログ集約システムを管理し、クロスアカウントのアクセス権限を維持するために貴重な時間を費やしています。このような従来のログ管理アプローチは、多大なリソースを消費するだけでなく、インシデント解決を遅らせ、顧客体験に影響を与える可能性があります。このブログでは、大規模環境向けのログ管理を簡素化する方法をご紹介します。

行く前に知っておきたい — AWS re:Invent 2024 モニタリングとオブザーバビリティ

12 月 2 日から 12 月 6 日までラスベガスで開催される AWS re: Invent 2024 に参加する予定で、モニタリングとオブザーバビリティについて詳しく知りたいとお考えですか? もしそうなら、このブログでは re:Invent 2024 でのモニタリングとオブザーバビリティに焦点を当てたクラウド運用に関連するセッションを取り上げています。

awso11yfes2024autumn

【開催報告 & 資料公開】AWS 秋の Observability 祭り 2024

本ブログでは、2024 年 11 月 1 日に実施した「AWS 秋の Observability 祭り ~明日使えるアセット祭り~」のイベントについて内容を簡単にご紹介しつつ、アセット資料を紹介致します。今回のイベントでは、すぐデプロイできるアセットを活用し Observability の高度化をジャンプスタートすることをテーマに様々なアセットをご紹介しました。アセットは生成 AI を活用した Observability での障害分析の効率化 、負荷試験における可視化や異常検知といった Observability で試験の速度と品質の改善、Amazon CloudWatch をさらに高度に活用するためのネットワーク監視、ログ異常検知機能による運用改善と複数のユースケースをカバーしています。

Amazon Bedrock Insights による CloudWatch アラームへの対応

クラウドで複雑な分散システムを運用する際、問題の原因を迅速に特定し、インシデントを解決することは大変な課題です。トラブルシューティングには、複数の AWS サービスからメトリクス、ログ、トレースをさらけずる必要があり、問題の全体像を把握することが難しくなります。しかし、この Alarm Context Tool (ACT) を使えば、効果的なインシデント解決に必要な時間と労力を削減できます。このブログでは、Amazon CloudWatch アラームに追加のコンテキストを提供する ACT ソリューションを紹介しています。ACT は、AWS Lambda 、Amazon CloudWatch 、AWS X-Ray 、AWS Health 、Amazon Bedrock を活用して、メトリクス、ログ、トレースを統合・分析し、有益な洞察を生成します。ACT を使えば、トラブルシューティングが簡素化され、運用コストを削減でき、AWS 環境の可観測性が向上します。

cloudops-1674-1024x576-1.png

Tomcat サーバー上で実行する Java アプリを Amazon CloudWatch Application Signals (プレビュー) で監視

このブログ記事では、WAR パッケージからデプロイされ、Tomcat サーバーで実行されている Java Web アプリケーションを Amazon CloudWatch Application Signals を使って自動的にインストルメンテーションする方法を紹介します。
Application Signals を有効にすることで、コールボリューム、可用性、レイテンシー、障害、エラーなどの主要メトリクスを利用して、アプリケーションサービスの現在の運用状態を迅速に確認してトリアージできるため、アプリケーションが長期的なパフォーマンスとビジネス上の目標を満たしているかを確認できます。