問題を効率的に見つけて修正し、アプリケーションの状態を改善し、より優れたカスタマーエクスペリエンスを提供します。

オブザーバビリティの 3 つの基本的なシグナルは、メトリクス、ログ (半構造化データ)、およびトレース (すべての依存関係の最初から最後までのリクエストのフロー) です。これらのシグナルは、コンテナ、マイクロサービス、アプリケーションなどのモニタリング対象環境の出力です。目標は、DevOps と Site Reliability Engineers のために統合されたエクスペリエンスを提供して、重要なイベントを分離し、すべてのオブザーバビリティシグナルを使用して、任意の場所で実行されているコンテナ化されたアプリケーションとマイクロサービスに問題を分離することです。Amazon OpenSearch Service は、ログとトレースのデータ分析を単一のソリューションに結合します。

Introduction to observability with Amazon OpenSearch Service on AWS On Air (AWS On Air での Amazon OpenSearch Service を利用したオブザーバビリティのご紹介) (21:19)

オブザーバビリティオペレーション

Amazon OpenSearch Service は、オブザーバビリティの問題を解決するのに役立つ新しい機能を提供します。オープンインターフェイスを使用して、テレメトリデータ (OpenTelemetryFluentdFluent BitLogstashData Prepper などを含む) を収集、ルーティング、および変換します。ネイティブ機能を使用して、大量の半構造化データを検索および分析できます。OpenSearch Dashboards の異常検出オブザーバビリティ機能を使用して視覚化、モニタリング、およびアラートを実行し、クエリインターフェイスである Piped Processing Language (PPL) を使用してデータのインタラクティブな分析と視覚化を実行できます。

Amazon OpenSearch Service は、オブザーバビリティ、トレース分析、ログ分析、およびアプリケーションパフォーマンスモニタリング (APM) の問題に次の 4 つの次元でアプローチします。

収集: まず、分析のためにデータを収集する必要があります。収集には、複数のソースからのデータの収集、強化、フィルタリング、変換、および正規化が含まれます。

検出: 多くの場合、お客様の下で問題が発生しても、その問題がすぐに検出されるわけではありません。問題が発生してから通知されるまでに時間がかかることがよくあります。この時間は可能な限り短くすべきです。検出はプロアクティブかつ多面的である必要があります (テレメトリのアラームなど)。異常検出は重要なツールであり、関連するアラームをリンクさせてアラーム疲れを軽減するための機能も備えています。検出のコアコンポーネントには視覚化とモニタリングも含まれており、Amazon OpenSearch Service は OpenSearch Dashboards と呼ばれるコンポーネントを使用してこれを実行します。 PPL などのツールを使用してデータをインタラクティブに分析することもできます。

調査: 調査は、運用イベント中に最も多くの時間が費やされる段階であり、通常、調査には複数の人員が必要です。これは、平均インシデント時間 (MTTI) と平均復旧時間 (MTTR) の最大の要因です。混乱を切り抜け、何に注力すべきかを理解することは、依然として困難な課題です。ログ、メトリクス、トレースを使用して、AWS、オンプレミス、またはその他のクラウドでメトリクス、ログ、およびトレースを相互に関連付けながら、根本原因の分析を迅速に実施できます。OpenSearch Dashboard ノートブックを使用して調査に協力し、分析結果を文書化します。

修復: 障害の原因を特定したら、それを修復する必要があります。何かを修復しようとして状況を悪化させることほど悪いことはありません。障害の発生に先立って失敗を防ぐにはどうすればよかったのかを判断するために、事後分析を実施することを忘れないでください。問題の再発を防ぐことができるように、提案された変更を文書化します。目標は、同じ問題が再発しないようにすることですが、再発した場合は、それを自動的に特定して修正できるようにする必要があります。

仕組み: OpenSearch Service

仕組み - OpenSearch Service

ログ分析については、取り込みパイプを構築するためのタスクがいくつかあります。プロデューサーは、バックエンドサーバー、AWS のサービス、ウェブサーバーなどです。これには、OpenTelemetryAWS Distro for OpenTelemetryJaeger、Zipkin が含まれます。コレクターはソースからデータを移動し、場合によってはデータをローカルに変換します。AWS ネイティブサービスについては、Amazon Kinesis Agent または Amazon CloudWatch Agent を使用できます。オープンソースについては、一般的なコレクターは、Elastic BeatsFluentdFluentbit、または OpenTelemetry Collector です。アグリゲーターはコレクターからの情報をバッファリングします。これにより、Amazon OpenSearch Service への全体的な接続が大幅に減少します。その後、Amazon OpenSearch Service はアグリゲーターの結果をインデックス化して分析します。結果を視覚化してモニタリングするために、OpenSearch Dashboards または Kibana を使用できます。

アプリケーションパフォーマンスモニタリング

場合によっては、アプリケーションパフォーマンスモニタリング (APM) がオブザーバビリティの最初の成熟度レベルになります。しかし、APM だけでは十分ではありません。アプリケーションモニタリングダッシュボードがすべて緑色であっても、アプリケーションは実際に想定どおりに動作していますか? お客様には必要なユーザーエクスペリエンスが提供されていますか? アプリケーションの用途は何ですか? アプリケーションのどの部分がスケール制限に達していますか? 最も大きく成長しているのはどの地域ですか? どの傾向を視覚化して計画できますか? メトリクスを収集できれば、新しいコードをデプロイしたり、インフラストラクチャを変更したりするときに、これらの変更の影響を確認できるので、確信に基づいて対応できます。オブザーバビリティにより、APM はこれらの追加の質問に対する回答を提供できます。

お客様

Chase International: スケールアップした常時接続のカスタマーエクスペリエンス
Dow Jones と 3M: Amazon OpenSearch Service によるオブザーバビリティ

オブザーバビリティのリソース

ブログとドキュメント

AWS の新着情報に関する記事


新しいオブザーバビリティインターフェースとログ分析

Amazon OpenSearch Service に、オブザーバビリティインターフェイスとログモニタリング機能が含まれるようになりました。これにより、デベロッパーや DevOps エンジニアは、パフォーマンスの問題をより迅速に診断し、アプリケーションのダウンタイムを削減するために必要なインサイトを得ることができます。

AWS ビッグデータブログ


トレース分析の開始方法

デベロッパーと IT Ops チームは、この機能を使用して、分散アプリケーションのパフォーマンスと可用性の問題をトラブルシューティングできます。

AWS ドキュメント


Amazon OpenSearch Service のトレース分析

OpenSearch Observability プラグインの一部である Trace Analytics を使用して、分散アプリケーションからのトレースデータを分析する方法を学びます。

オブザーバビリティのユースケース


オブザーバビリティとは

OpenSearch Observability プラグインの一部である Trace Analytics を使用して、分散アプリケーションからのトレースデータを分析する方法を学びます。

オブザーバビリティの記事


効率を超える: 可観測性によってデジタルの複雑さを克服する

組織はシステムパフォーマンスを最適化しようとしていますが、その機会を逃しています。このレポートでは、企業がオブザーバビリティの手法を統合して効率を高め、セキュリティの脅威に関するインサイトを提供し、ブランドの評判を高める方法をご紹介します。

ワークショップ

Amazon OpenSearch Service のオブザーバビリティ機能を使用すると、単純なモニタリングを超えて、どのようなイベントが発生しているのかだけでなく、なぜ発生しているのかを理解することができます。このワークショップでは、ユーザーフロントエンドからサービスバックエンドまで、およびその間のあらゆるものについて、メトリクス、トレース、およびログデータを計測、収集、分析する方法を学びます。これを Amazon OpenSearch Service、AWS Distro for OpenTelemetry、FluentBit、および Data Prepper と組み合わせます。

AWS Workshop Studio: Microservice observability with Amazon OpenSearch Service (AWS Workshop Studio: Amazon OpenSearch Service によるマイクロサービスのオブザーバビリティ)

Github workshop samples: Microservice observability with Amazon OpenSearch Service (Github ワークショップのサンプル: Amazon OpenSearch Service によるマイクロサービスのオブザーバビリティ)

AWS リファレンスアーキテクチャ図

ログ、トレース、メトリクスによるオブザーバビリティ

詳細はこちら »

動画

Ensure reliability and uptime with observability solutions (オブザーバビリティソリューションで信頼性とアップタイムを確保)
Amazon OpenSearch Service によるオブザーバビリティの導入

ポッドキャスト

New observability features from Amazon OpenSearch Service (Amazon OpenSearch Service の新しいオブザーバビリティ機能)

よくある質問

Q: Trace Analytics とは何ですか?
Trace Analytics は、Amazon OpenSearch Service の新機能であり、デベロッパーと IT オペレーターが分散アプリケーションのパフォーマンスの問題を見つけて修正できるようにします。これにより、問題解決に要する時間を短縮できます。Trace Analytics は、Cloud Native Computing Foundation (CNCF) プロジェクトである OpenTelemetry を使用して構築されています。これは、分散型のトレースとメトリクスをキャプチャできるようにするため、API、ライブラリ、エージェント、およびコレクターサービスの単一のセットを提供します。これにより、お客様は、アプリケーションを再インストルメントする必要なく、Trace Analytics をご活用いただけます。Trace Analytics は、OpenSearch を利用しており、オープンソースで、どなたでも無料でダウンロードしてご利用いただけます。

Q: Trace Analytics を使用べきなのはなぜですか?
デベロッパーと IT Ops は、分散アプリケーションのパフォーマンスの問題を見つけて修正するために Trace Analytics を必要としています。Amazon OpenSearch Service に既に備わっているログ分析機能に、新たなトレースデータを追加することで、このサービスを、パフォーマンスの問題の発生源を切り離すことや、その根本原因を探ることにも利用できるようになりました。さらに、OpenTelemetry 標準のサポートにより、Trace Analytics は、Jaeger および Zipkin SDK といった 2 つの人気のあるオープンソース分散トレースシステムとの統合をサポートします。これにより、デベロッパーは、アプリケーションを再インストルメントすることなく、これらの SDK を引き続き使用できます。

Trace Analytics は Amazon OpenSearch Service とどのように関連/連携しますか?
Trace Analytics は、Amazon OpenSearch Service の統合機能です。すべてのお客様は、追加料金なしでご利用いただけます。Trace Analytics は、トレースデータを視覚化および探索するための OpenSearch ダッシュボードおよび Kibana をベースにしたユーザーインターフェイスを備えており、異常検出、アラート、きめ細かいアクセスコントロール、エンタープライズセキュリティなどの Amazon OpenSearch Service の主要機能と統合されています。Trace Analytics は、アプリケーションのパフォーマンスの問題を解決する際のログデータの検索と分析のために、お客様による Amazon OpenSearch Service のご利用を補完します。

Q: Trace Analytics はどのデータソースをサポートしていますか?
現在、Trace Analytics は、オープンソースの OpenTelemetry Collector と互換性のあるアプリケーションライブラリと SDK の一連のトレースデータをサポートしています。これらのライブラリには、JaegerZipkin、および X-Ray SDK が含まれます。また、Trace Analytics は、OpenTelemetry API、SDK、およびエージェント/コレクターのディストリビューションである AWS Distro for OpenTelemetry とも統合されています。これは、OpenTelemetry コンポーネントのパフォーマンスが高く安全なディストリビューションであり、本稼働環境での使用がテストされており、AWS によってサポートされています。AWS Distro for OpenTelemetry を使用することにより、複数のモニタリングソリューションで使用するためにトレースやメトリクスを収集できます。これらのソリューションには、Amazon OpenSearch Service や AWS X-Ray (トレースデータ用)、Amazon CloudWatch (メトリクス用) などが含まれます。

Q: Trace Analytics の使用を開始するにはどうすればよいですか?
Trace Analytics の使用を開始するには、こちらのドキュメントに従ってください。

Amazon OpenSearch Service の料金の詳細
料金ページにアクセスする

Amazon OpenSearch Service の料金の詳細をご覧ください。

詳細 
無料のアカウントにサインアップ
無料のアカウントにサインアップ

AWS 無料利用枠にすぐにアクセスできます。 

サインアップ 
コンソールで構築を開始する
構築を始めましょう。

AWS マネジメントコンソールで構築を始めましょう。

使用を開始する