Amazon OpenSearch Service による「EC サイト検索ワークショップ」と「Observability Stack ワークショップ」のご紹介

2025 年 3 月に Amazon OpenSearch Service による検索ワークショップ（日本語版）のご紹介という記事を公開し、OpenSearch の基本概念から AI を活用した検索までを学べる日本語ワークショップをご案内しました。

このたび、2 つの日本語版ワークショップが仲間入りいたしましたので、ご紹介いたします。

EC サイト検索ワークショップ：架空の EC サイトを題材に、検索機能を全文検索からセマンティック検索、マルチモーダル検索、エージェント検索へと段階的に育てていくワークショップです。また、ユーザーの行動ログを使った品質計測、機械学習による最適化を体験いただける実験的なラボも付属しています。
OpenSearch Observability Stack ワークショップ：OpenSearch を Observability のバックエンドとして使い、マイクロサービスの APM・ログ・メトリクスを横断しながら、Agentic AI も活用して障害の原因を調査するワークショップです。Agent Trace といった新しい OpenSearch の Observability 関連機能もお試しいただけます。

以降、2 つのワークショップの概要について説明してまいります。

EC サイト検索ワークショップ

架空の企業「AnyCompany」が運営する EC サイトを題材に、商品検索を少しずつ改善していくシナリオ形式のワークショップです。OpenSearch の全文検索の導入からスタートし、ファセットやセマンティック検索、エージェント検索に至るまで検索機能を段階的に進化させていきます。

FastAPI + htmx による EC サイト風の検索 UI が付属しており、機能追加によって検索結果がどのように変化していくかを実際に比較・確認しながら進めることが可能です。

本ラボは Amazon SageMaker Studio の JupyterLab 上でノートブックを順次実行しながら進めていきます。商品のマスター情報は Amazon Aurora PostgreSQL に、検索インデックスは Amazon OpenSearch Service に格納されています。各種 ML モデルへのアクセスは、OpenSearch の connector を経由して行われます。

主要なリソースは以下のとおりです。

リソース	用途
Amazon OpenSearch Service	検索エンジン
Amazon Aurora Serverless v2	商品マスターデータ（PostgreSQL）
Amazon SageMaker Studio	ノートブック実行環境（JupyterLab）
Amazon SageMaker AI	Embedding モデルのホスティング
Amazon Bedrock	LLM の利用（Agentic Query）

ワークショップの構成

本ワークショップは 2 つのトラックが存在します。トラック A のみでもお楽しみいただけますが、トラック B まで実行することでより検索に対する理解を深めることができます。

トラック A: 検索機能の改善

トラック A は機能の改善にフォーカスしています。4 つのラボで構成されています。

全文検索の導入: OpenSearch の全文検索を導入し、形態素解析器 Sudachi による日本語トークナイズ、複数フィールドをまたいで検索する multi_match、関連度スコアによるランキングを実装します。検索エンジンがなぜ高速に全文検索できるのか、その心臓部にあたる転置インデックスの仕組みにも触れます。
セマンティック検索の導入: テキストの「意味」で探すセマンティック検索を導入します。OpenSearch 3.1 で追加された semantic フィールドを使えば、インジェストパイプラインを書かずにベクトル検索を実現できます。Embedding モデルには日本語特化の ruri-v3-310m（Apache 2.0）を SageMaker エンドポイントで利用し、BM25 とセマンティック検索を組み合わせたハイブリッド検索も体験します。
マルチモーダル検索の導入: テキストだけでなく、画像で商品を探す体験を追加します。「この写真に似た商品を探して」といったユースケースに応えるため、画像とテキストを同じベクトル空間にマッピングする CLIP（clip-japanese-base-v2）を使います。Ingest Pipeline の text_image_embedding プロセッサが投入時に画像を自動でベクトル化するので、テキストから画像を探す検索と、画像から似た画像を探す検索の両方を、1 つのベクトルフィールドだけで実現できます。
エージェント検索の導入: OpenSearch 3.2 で追加された Agentic Query を使い、自然言語で商品を検索できるようにします。ユーザーの質問を LLM が QueryDSL に変換し、思考の過程も含めた結果を出力します。Amazon Bedrock 上の Anthropic Claude モデルと組み合わせて、検索バーに軽量な Flow Agent（Claude Haiku 4.5）を、チャット UI にはメモリ機能をサポートした Conversational Agent（Claude Sonnet 4.6）を搭載し、その違いを比較します。

トラック B: 計測と改善

トラック B は計測と精度改善にフォーカスしています。3 つのラボで構成されています。

ユーザー行動ログの蓄積と分析: UBI（User Behavior Insights）は、検索クエリ・クリック・カート追加・購入といったユーザー行動を、標準スキーマで記録する仕組みです。本ワークショップではサンプルの行動データを使った分析を実際に体験します。
検索品質評価: UBI データを使って、検索品質を数値で評価します。Search Relevance Workbench（SRW）と呼ばれるツールを活用し、テキスト検索やハイブリッド検索等の各種検索手法がどのようなクエリで有効であるかを評価指標に基づいて分析します。人間による分析に加えて、MCP + Strands Agent を活用したエージェントによる分析も応用パートとして提供しています。
Learning to Rank: UBI データと SRW の判定セットを学習データに使い、XGBoost（LambdaMART）でモデルを学習します。そして、ハイブリッド検索で絞り込んだ上位を LTR で並べ替える 2 段階ランキングを構築します。特徴量は BM25 派生のものから始め、人気度や在庫といったビジネス特徴量、さらにユーザーのペルソナを段階的に組み込んでいきます。

OpenSearch Observability Stack ワークショップ

OpenSearch Observability Stack は、OpenSearch と Prometheus をバックエンドとした、Observability プラットフォームです。Piped Processing Language (PPL) によるトレース・ログ・メトリクスの分析、ダッシュボード上での可視化、Agent Trace、アラートや異常検知といった機能を OpenSearch UI と呼ばれるダッシュボードを通じて利用することができます。Ask AI と呼ばれる機能を活用した AI によるインシデント分析も可能です。

このワークショップでは、16 のマイクロサービスで構成されている EC サイトで発生した問題を、OpenSearch Dashboards の Observability 機能と Agentic AI（AI アシスタント）を用いて調査を行いながら各機能についての理解を深めていく内容となっています。

OpenTelemetry Demo（EC サイトを模した 16 のマイクロサービス）を Amazon EKS 上にデプロイし、OpenTelemetry Collector が集めたトレース・ログ・メトリクスを Amazon OpenSearch Ingestion（OSIS）と Amazon Managed Service for Prometheus（AMP）に送り込む構成となっています。

OSS 版ではセルフホストが必要な部分を AWS マネージドサービスに置き換えているため、参加者はインフラの構築ではなく、Observability の体験そのものに集中できます。

ワークショップの流れ

ラボは基本的に任意の個所から開始することが可能ですが、順番に進めることでよりスムーズに理解を深めることができます。

ラボ 1. Application Performance Monitoring による調査

Application Map でサービス間の依存関係とエラー率を一目で把握し、RED メトリクス（Rate, Errors, Duration）から問題のあるサービスを判定、関連するトレースやログを確認していきます。

ラボ 2. Ask AI によるサービス障害調査

OpenSearch Dashboards に組み込まれた Ask AI に、「直近で一番エラーの多いサービスは？」と自然言語で尋ねるところから始めます。Investigation Agent が、複数のデータソースを自律的に横断して根本原因の仮説を立て、その調査過程をノートブックとしてまとめる様子を見ることができます。

ラボ 3. Discover による分析

ログ・トレース・メトリクスを、PPL（Piped Processing Language）や PromQL を活用して横断的に掘り下げて分析します。

ラボ 4. Dashboard に集約する

Discover で作成した Visualization を Dashboard に集約し、チームで共有できる運用ダッシュボードを構築します。

ラボ 5. 異常検知・アラート・Forecast

OpenSearch の組み込み ML を使い、Anomaly Detection（Random Cut Forest）による異常検知、Alerting による通知、Forecasting による将来の予測を設定します。

その他のラボ

本ワークショップでは、他にも応用的なラボをいくつか提供しています。

例えば、Agent Trace と呼ばれる機能を活用して、Amazon Bedrock 上の Anthropic Claude を使った商品レコメンドエージェントが生成する gen_ai.* スパンを分析し、Agent の思考の流れ（Agent Graph）やトークン使用量の可視化などを体験することができます。

ワークショップの始め方

Workshop Studio にアクセスし、トップページから取り組みたいワークショップを選んでください。

各ワークショップには CloudFormation テンプレートが付属しており、ご自身の環境に必要な AWS リソースを簡単にデプロイすることが可能です。ご自身の AWS アカウントでも、AWS イベント会場で Workshop Studio が払い出す一時アカウントでも実施できます。

リソース展開後は、SageMaker Studio（JupyterLab）もしくは OpenSearch Dashboards にアクセスし、ノートブックや Workshop Studio サイトの手順に沿って学習を進めていきます。

なお、ご自身の AWS アカウントで実施する場合は、OpenSearch・Aurora・SageMaker・EKS などのリソース利用に応じた料金が発生します。ワークショップを終えたら、クリーンアップ手順に従ってリソースを削除してください。

まとめ

今回追加された二つのワークショップはいずれもユースケースに即した内容となっており、一連のラボを通して OpenSearch に関する最新の知見や活用イメージの把握に繋げることができます。

EC サイト検索ワークショップでは、検索機能を段階的に育て、その効果を計測し、機械学習で改善するまでの一連のサイクルを体験できます。OpenSearch Observability Stack ワークショップでは、検索エンジンとは違う一面、Observability のバックエンドとしての OpenSearch と、Agentic AI を取り入れた分析を体験することができます。

検索から Observability、そして AI Agent の活用まで、ハンズオンを通して OpenSearch の可能性に是非触れてみてください。

Amazon Web Services ブログ