問題を効率的に見つけて修正し、アプリケーションの状態を改善し、より優れたカスタマーエクスペリエンスを提供します。

オブザーバビリティの 3 つの基本的なシグナルは、メトリクス、ログ (半構造化データ)、およびトレース (すべての依存関係の最初から最後までのリクエストのフロー) です。これらのシグナルは、コンテナ、マイクロサービス、アプリケーションなどのモニタリング対象環境の出力です。目標は、DevOps と Site Reliability Engineers のために統合されたエクスペリエンスを提供して、重要なイベントを分離し、すべてのオブザーバビリティシグナルを使用して、任意の場所で実行されているコンテナ化されたアプリケーションとマイクロサービスに問題を分離することです。Amazon OpenSearch Service は、ログとトレースのデータ分析を単一のソリューションに結合します。

Introduction to observability with Amazon OpenSearch Service on AWS On Air (AWS On Air での Amazon OpenSearch Service を利用したオブザーバビリティのご紹介) (21:19)

オブザーバビリティオペレーション

Amazon OpenSearch Service は、オブザーバビリティの問題を解決するのに役立つ新しい機能を提供します。オープンインターフェイスを使用して、テレメトリデータ (OpenTelemetryFluentd、FluentbitLogstashData Prepper などを含む) を収集、ルーティング、および変換します。ネイティブ機能を使用して、大量の半構造化データを検索および分析できます。OpenSearch Dashboards の異常検出オブザーバビリティ機能を使用して視覚化、モニタリング、およびアラートを実行し、クエリインターフェイスである Piped Processing Language (PPL) を使用してデータのインタラクティブな分析と視覚化を実行できます。

Amazon OpenSearch Service は、オブザーバビリティ、トレース分析、ログ分析、およびアプリケーションパフォーマンスモニタリング (APM) の問題に次の 4 つの次元でアプローチします。

収集: まず、分析のためにデータを収集する必要があります。収集には、複数のソースからのデータの収集、強化、フィルタリング、変換、および正規化が含まれます。

検出: 多くの場合、お客様の下で問題が発生しても、その問題がすぐに検出されるわけではありません。問題が発生してから通知されるまでに時間がかかることがよくあります。この時間を可能な限り短くしたいはずです。検出はプロアクティブかつ多面的である必要があります (つまり、テレメトリのアラーム)。異常検出は重要なツールであり、関連するアラームをリンクさせてアラーム疲れを軽減するための機能も備えています。検出のコアコンポーネントには視覚化とモニタリングも含まれており、Amazon OpenSearch Service は OpenSearch Dashboards と呼ばれるコンポーネントを使用してこれを実行します。 PPL などのツールを使用してデータをインタラクティブに分析することもできます。

調査: 調査は、運用イベント中に最も多くの時間が費やされる段階であり、通常、調査には複数の人員が必要です。これは、平均インシデント時間 (MTTI) と平均復旧時間 (MTTR) の最大の要因です。混乱を切り抜け、何に注力すべきかを理解することは、依然として困難な課題です。ログ、メトリクス、およびトレースを活用して、メトリクス、ログ、およびトレースを相互に関連付けながら、根本原因の分析を迅速に実施できます。また、OpenSearch Dashboard ノートブックを使用して調査に協力し、分析結果を文書化します。

修復: 障害の原因を特定したら、それを修復する必要があります。何かを修復しようとして状況を悪化させることほど悪いことはありません。障害の発生に先立って失敗を防ぐにはどうすればよかったのかを判断するために、事後分析を実施することを忘れないでください。問題の再発を防ぐことができるように、提案された変更を文書化します。目標は、同じ問題が二度と発生しないようにすることですが、再発した場合は、それを自動的に特定して修正できるようにする必要があります。

仕組み: OpenSearch Service

仕組み - OpenSearch Service

ログ分析については、取り込みパイプを構築するためのタスクがいくつかあります。プロデューサーは、バックエンドサーバー、AWS のサービス、ウェブサーバーなどです。これには、OpenTelemetryAWS Distro for OpenTelemetryJaeger、Zipkin が含まれます。コレクターはソースからデータを移動し、場合によってはデータをローカルに変換します。AWS ネイティブサービスについては、Amazon Kinesis Agent または Amazon CloudWatch Agent を使用できます。オープンソースについては、一般的なコレクターは、Elastic BeatsFluentdFluentbit、または OpenTelemetry Collector です。アグリゲーターはコレクターからの情報をバッファリングします。これにより、Amazon OpenSearch Service への全体的な接続が大幅に減少します。その後、Amazon OpenSearch Service はアグリゲーターの結果をインデックス化して分析します。結果を視覚化してモニタリングするために、OpenSearch Dashboards または Kibana を使用できます。

アプリケーションパフォーマンスモニタリング

場合によっては、アプリケーションパフォーマンスモニタリング (APM) がオブザーバビリティの最初の成熟度レベルになります。しかし、APM だけでは十分ではありません。アプリケーションモニタリングダッシュボードがすべて緑色であっても、アプリケーションは実際に想定どおりに動作していますか? お客様には必要なユーザーエクスペリエンスが提供されていますか? アプリケーションの用途は何ですか? アプリケーションのどの部分がスケール制限に達していますか? 最も大きく成長しているのはどの地域ですか? どの傾向を視覚化して計画できますか? メトリクスを収集できれば、新しいコードをデプロイしたり、インフラストラクチャを変更したりするときに、これらの変更の影響を確認できるので、確信に基づいて対応できます。オブザーバビリティにより、APM はこれらの追加の質問に対する回答を提供できます。

オブザーバビリティのリソース

ブログとドキュメント

AWS の新着情報に関する記事


新しいオブザーバビリティインターフェースとログ分析

Amazon OpenSearch Service に、オブザーバビリティインターフェイスとログモニタリング機能が含まれるようになりました。これにより、デベロッパーや DevOps エンジニアは、パフォーマンスの問題をより迅速に診断し、アプリケーションのダウンタイムを削減するために必要なインサイトを得ることができます。

AWS ビッグデータブログ


トレース分析の開始方法

デベロッパーと IT Ops チームは、この機能を使用して、分散アプリケーションのパフォーマンスと可用性の問題をトラブルシューティングできます。

AWS ドキュメント


Amazon OpenSearch Service のトレース分析

OpenSearch Observability プラグインの一部である Trace Analytics を使用して、分散アプリケーションからのトレースデータを分析する方法を学びます。

オブザーバビリティのユースケース


オブザーバビリティとは

OpenSearch Observability プラグインの一部である Trace Analytics を使用して、分散アプリケーションからのトレースデータを分析する方法を学びます。

ワークショップ

Amazon OpenSearch Service のオブザーバビリティ機能を使用すると、単純なモニタリングを超えて、どのようなイベントが発生しているのかだけでなく、なぜ発生しているのかを理解することができます。このワークショップでは、ユーザーフロントエンドからサービスバックエンドまで、およびその間のあらゆるものについて、メトリクス、トレース、およびログデータを計測、収集、分析する方法を学びます。これを Amazon OpenSearch Service、AWS Distro for OpenTelemetry、FluentBit、および Data Prepper と組み合わせます。

AWS Workshop Studio: Microservice observability with Amazon OpenSearch Service (AWS Workshop Studio: Amazon OpenSearch Service によるマイクロサービスのオブザーバビリティ)

Github workshop samples: Microservice observability with Amazon OpenSearch Service (Github ワークショップのサンプル: Amazon OpenSearch Service によるマイクロサービスのオブザーバビリティ)

動画

オブザーバビリティソリューションで信頼性とアップタイムを確保

ポッドキャスト

Amazon OpenSearch Service の料金の詳細
料金ページにアクセスする

Amazon OpenSearch Service の料金の詳細をご覧ください。

詳細 
無料のアカウントにサインアップ
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
コンソールで構築を開始する
構築を始めましょう。

AWS マネジメントコンソールで構築を始めましょう。

使用を開始する