オブザーバビリティとモニタリングの違いは何ですか?

DevOps では、オブザーバビリティとモニタリングは 2 つの異なるデータベースのプロセスです。これらを使用すると、分散型マイクロサービスアーキテクチャとそのインフラストラクチャの正常性とパフォーマンスを適切に維持および管理できます。分散システムは、数十から数百、または数千の異なるコンポーネント間でデータを交換することによって機能します。 

監視とは、システムの状態を定義するさまざまな指標に関するデータを収集し、レポートを生成するプロセスです。オブザーバビリティはより調査的なアプローチです。分散したシステムコンポーネントの相互作用と監視によって収集されたデータを詳しく調べて、問題の根本原因を特定します。これには、トレースパス分析などのアクティビティが含まれます。トレースパス分析は、システムを通じてリクエストのパスをたどって統合の失敗を特定するプロセスです。モニタリングは個々のコンポーネントに関するデータを収集し、オブザーバビリティは分散システム全体を監視します。

DevOps について読む

仕組み:オブザーバビリティとモニタリング

オブザーバビリティとモニタリングはどちらも、効果的な DevOps プログラムを実行するために不可欠なプロセスです。

モニタリング

コンピューティングシステムの監視は、コンピューティングシステム自体を実行するのと同じくらい古い慣習です。監視プロセスは、システムに関するデータを収集して、システムが期待どおりに動作しているかどうかを確認します。エラー、障害、または異常なデータ値に関するレポートとアラートが含まれます。 

たとえば、監視ツールはデータを収集して、アプリケーションリリースのデプロイにかかる時間を測定できます。所要時間が予想外の場合、監視ツールはユーザーに警告し、何か問題が発生した可能性があることを知らせます。 

DevOps モニタリングは、ソフトウェア開発ライフサイクル (SDLC) 全体をカバーします。アプリケーションパフォーマンス監視 (APM) は、本番環境で実行されているアプリケーションに焦点を当てた DevOps 監視の特殊なサブセットです。ユーザーエクスペリエンスに適用される指標に優先順位を付けます。

ソフトウェア開発ライフサイクルについて読む

アプリケーションパフォーマンスモニタリングについて読む

オブザーバビリティ

オブザーバビリティは、従来の監視ツールよりも広い範囲と可視性をもたらし、状況データや履歴データ、システム相互作用を追加で取り入れることができます。これにより、監視アラートの根本原因を調査できるほか、複数のコンポーネントの相互作用によって発生する問題を調査できます。

オブザーバビリティツールを使用して、分散アプリケーションアーキテクチャベースのシステム自体をデバッグできます。また、これらを使用して、システム全体の状態やシステムコンポーネント間の相互作用をリアルタイムで観察することもできます。オブザーバビリティソフトウェアを使用すると、相互接続されたシステム全体、その依存関係、およびリアルタイムの相互作用をマッピングできます。

オブザーバビリティとモニタリングにはどのような類似点がありますか?

オブザーバビリティもモニタリングも、もともとはシステム工学と数学の分野である制御理論の分野に由来しています。どちらも、システムの状態とパフォーマンスを維持するために、コンピューティングやコンピューティングが混在する物理環境全体で広く使用されています。DevOPs では、両者はメトリクス、イベント、ログ、トレースなどのテレメトリデータに関連しているため、これらの用語はしばしば同じ意味で使用されます。

メトリクス

メトリックはシステムデータの測定値です。たとえば、メトリックには、ネットワークスループットや 1 週間におけるアプリケーションエラーの数などがあります。メトリクスとオブザーバビリティに関するモニタリングレポートは、その価値を向上させる方法を探します。

イベント

イベントは、システム内で任意の時点で発生する個別のアクションです。例としては、ユーザーがパスワードを変更した場合や、パスワードの入力回数が多いことを示すアラートなどがあります。イベントによって監視が開始され、インシデント調査におけるオブザーバビリティが向上します。

ログ

ログは、システムの操作、アクティビティ、使用パターンに関する情報を含むソフトウェア生成ファイルです。この情報をコンテキスト化するために、ログファイルには、すべてのプロセス、イベント、およびメッセージの履歴記録と、タイムスタンプなどの追加の説明データが含まれます。モニタリングではログが生成され、オブザーバビリティはこれを今後のシステム分析に使用します。

ログファイルについて読む

トレース

トレースは、相互に関連するさまざまなシステム間の 1 つのオペレーションのフルパスです。完全分散型トレーシングでは、追跡用のマイクロサービスアーキテクチャ内のすべてのトランザクションからシグナルを送信する必要があります。モニタリングにより、オブザーバビリティの重要な機能であるトレースが可能になります。

オブザーバビリティとモニタリング:主な違い

モニタリングはオブザーバビリティの重要なコアコンポーネントです。包括的な監視により、重要なものを簡単に識別して取得できる方法で測定する記述的な指標、イベント、ログ、トレースが作成されます。履歴記録は現在の測定値とともに保存され、システムの全体像を把握できます。オブザーバビリティは、監視によって生み出された情報を利用して、インシデントをより深く調査できるようになります。

監視はシステムエラーの発生時期と発生原因でありオブザーバビリティはその理由と発生原因ですシステム全体の内部状態と状態を全体的に把握するために、マッピングや監視を行う必要がある信号は多数あります。効果的な調査を行うには、これらすべてのデータが必要です。オブザーバビリティが有用かつ効果的であるためには、モニタリングは包括的かつ説明的でなければなりません。

異常

監視システムを使用すると、システムの状態やパフォーマンスの異常や異常な動作を発見できます。オブザーバビリティがあれば、たとえ何百ものサービスコンポーネント間の相互作用が原因で発生したとしても、異常をさらに調査できます。

原因と結果

監視は、ある値または値を測定して、システムに影響があるかどうかを確認することに重点を置いています。オブザーバビリティの目標は、その影響の原因を理解することです。たとえば、新しいコードがリリースされると、モニタリングはシステムメトリクスを追跡して、アプリケーションのロード時間やデータ取得時間が変更の影響を受けるかどうかを確認します。影響が生じた場合、オブザーバビリティによって理由または原因が調査されます。コード変更のどの部分が影響を引き起こしたのかを回答し、修正方法を提案します。

システムインタラクション

監視は通常、特定のシステムの状態を測定します。さまざまなシステムコンポーネントすべてに関するデータを収集しますが、データは分離されている可能性があり、相互関係を理解するのは困難です。オブザーバビリティにより、相互に関連するすべてのシステムの全体像を把握し、問題がどこでどのように発生しているかを理解できます。

使用タイミング:オブザーバビリティとモニタリング

ユーザーから障害を知ったり、アプリケーションが間違ったターゲットシステムで実行されていることを発見したりするなど、遡及的なエラーキャッチを行うと、時間、費用、評判、および開発者リソースが失われる可能性があります。監視は、積極的にエラーをキャッチするための必須アイテムです。監視ツールはあらゆる種類の不一致についてアラートを発し、長期的な影響が出る前に特定して修正できます。

監視可能なシステムは、既存の監視機能に追加されます。マイクロサービスアプリケーションアーキテクチャを実行する場合、特に分散型クラウドインフラストラクチャにデプロイする場合は不可欠です。監視だけでは、エラーが発生するアプリケーションやサービスを特定して切り分けることはほぼ不可能になります。適切なデータキャプチャとモニタリングとオブザーバビリティを組み合わせることで、複雑なシステムでもエラーを追跡できます。

相違点の要約:モニタリングとオブザーバビリティ

 

モニタリング

オブザーバビリティ

内容

システム内の特定のメトリックを測定して報告することで、システムの状態を確保します。

メトリクス、イベント、ログ、トレースを収集することで、マイクロサービスアーキテクチャを備えた分散システム全体の健康問題を詳細に調査できます。

主な焦点

データを収集して異常なシステム効果を特定します。

異常なシステム影響の根本原因を調査します。

関係するシステム

通常、スタンドアロンシステムに関係します。

通常、複数の異なるシステムに関係します。

トレーサビリティ

システムのエッジに限定されます。

異なるシステムアーキテクチャ間で信号が送信される場合に使用できます。

システムエラー発見

いつ何を.

理由方法

AWS はオブザーバビリティとモニタリングの要件にどのように役立ちますか?

AWS クラウドオペレーションは、クラウドで安全かつ効率的に運用するためのモデルとツールを提供します。Amazon Web Services (AWS) を使用して、組織を変革し、アプリケーションを最新化および移行し、イノベーションを加速することができます。 

クラウド運用におけるモニタリングとオブザーバビリティにより、テレメトリの収集、関連づけ、集約、分析が可能になります。これは、クラウド、ハイブリッド、またはオンプレミス環境のネットワーク、インフラストラクチャ、およびアプリケーション全体に適用されます。システムの動作、パフォーマンス、状態に関する洞察を得ることができます。これらの洞察により、問題をより迅速に検出、調査、修正できます。人工知能 (AI) や機械学習 (ML) と組み合わせることで、これらの洞察を活用して積極的に問題に対応し、予測し、防止することができます。

たとえば、次のことができます。

  • AWS X-Ray では、本番環境と分散アプリケーションの分析とデバッグ、ユーザーリクエストの追跡、ボトルネックの特定、パフォーマンスの監視を行います。
  • Amazon CloudWatch では、AWS、オンプレミス、その他のクラウドにある強力な視覚化ツールを使用して、リソースやアプリケーションのデータや外部出力にアクセスして分析できます。
  • Amazon Managed Grafana を管理して、運用データ全体のメトリックス、ログ、トレースに関するクエリ、視覚化、アラートを行う Grafana (人気のモニタリングツール) を完全に管理できるようにしました
  • Prometheus 用 Amazon マネージドサービスにより、Prometheus を完全に管理できます。Prometheus は、セルフマネージド型のコンテナクラスターから時系列メトリックスを管理およびクエリするためのコンテナモニタリングツールです。

今すぐアカウントを作成して、AWS でのモニタリングとオブザーバビリティを始めましょう。