Amazon Web Services ブログ

Amazon Quick Sight を使用して SQL なしでデータ準備フローを構築する

本記事は、2025 年 10 月 23 日に公開された Transform and visualize your data preparation flow in Amazon Quick Sight without SQL を翻訳したものです。翻訳は Public Sector PSA の西川継延が担当しました。

Amazon Quick Sight は、Amazon Quick Suite の機能の 1 つで、AI を活用したビジネスインテリジェンス (BI) 機能を提供し、散在するデータを戦略的なインサイトに変換して、より迅速な意思決定とより良いビジネス成果の達成を支援します。

データ準備は、特にビジネスユーザーが SQL の専門知識を持っていない場合、分析において最も時間のかかる部分であることが多いです。アナリストは通常、インサイトを生成するよりもデータ準備に多くの時間を費やしています。この課題は、データが複数のシステムや期間にわたってサイロ化されていることが多い小売組織において、特に重要です。

この投稿では、中規模の小売企業である AnyCompany (この投稿のための架空の企業) が、新しい Quick Sight データ準備エクスペリエンスを使用して、ビジネスアナリストが SQL を一行も書かずに複雑なデータを変換する方法を探ります。アナリストが、Append、Join、Unpivot、Aggregate などの機能を使用して、シンプルなポイントアンドクリックインターフェイスを通じて複雑なデータの課題を解決する方法、およびデータセットをさらなる変換のソースとして再利用できるようにすることで、チーム間のコラボレーションを可能にする方法を見ていきます。

データ準備における課題

AnyCompany は、USB ハブ、壁掛け時計、収納ボックス、その他の家庭用品やオフィス用品など、さまざまな消費者向け製品を販売しています。同社のアナリティクスチームは、過去の販売データと予測を組み合わせて、地域全体でマーケティング費用を最適化する必要があります。

この企業はいくつかのデータに関する課題に直面しています:

  • 売上データは年度 (2023、2024、2025) ごとに複数のテーブルに分割されています
  • 製品情報と地域情報は別々のディメンションテーブルに存在します
  • データソース間でデータ形式の不整合が存在します (例: 郵便番号の形式)
  • 予測データは列指向構造の Excel ファイルに保存されています

以前は、これらの課題には SQL の専門知識が必要であったり、技術チームからの支援を待つ必要がありました。新しい Quick Sight データ準備エクスペリエンスにより、AnyCompany のビジネスアナリストはこれらの問題を独立して解決できるようになりました。

ソリューション概要

AnyCompany は、Quick Sight を使用して共同データ準備ワークフローを実装しました。

  1. グローバルアナリストが、売上、製品、地域データを組み合わせた基盤データセットを作成します。
  2. 地域アナリストが、その基盤に地域固有の分析と予測を追加します。
  3. GUI ベースのビジュアルデータ編集準備機能により、アナリストは複雑な SQL クエリを記述することなく、高度なデータ変換を実行できます。
  4. SPICE (Super-fast, Parallel, In-memory Calculation Engine) が、最適なパフォーマンスを実現するインメモリ計算エンジンを提供します。

グローバルアナリストのジャーニー

AnyCompany のグローバルアナリストは、複数年のデータと製品および地域情報を組み合わせた包括的な売上データセットを作成する必要があります。SQL の知識が限られているにもかかわらず、アナリストは新しい Quick Sight データ準備エクスペリエンスを使用してこの基盤を構築することができます。

複数年にわたる売上基盤の構築

グローバルアナリストは、まず 2023 年の売上データを調査します。このデータには、product_idcustomer_idorder_dateship_datesalesquantitydiscount などの注文詳細が含まれています。次のスクリーンショットは、これらのカラムの一部の例を示しています。

Quick Sight の Append 機能を使用することで、アナリストはわずか数クリックで 2024 年と 2025 年の売上データを結合できます。各ステップ後の Preview タブにより、アナリストはデータが正しく結合されていることをすぐに確認でき、変換プロセスに対する信頼性を高めることができます。

ディメンションデータによるエンリッチメント

統合された売上データが準備できたら、アナリストはそれを製品ディメンションテーブルと結合します。Quick Sight での結合操作は簡単です。アナリストは結合するテーブルと共通キー (product_id) を選択するだけで、プレビューには製品情報と売上データが並んだ拡張されたデータセットがすぐに表示されます。

しかし、地域ディメンションテーブルとの結合を試みると、アナリストはデータ品質の課題に直面します。Preview タブを見ると、売上データと地域テーブルの郵便番号が一致していないことがわかります。売上データの一部の郵便番号は 5 桁以上あり、地域テーブルでは郵便番号が文字列ではなく整数として保存されています。

データ型の不整合の解決

Quick Sight は、これらの不整合を解決するための変換機能を提供しています。1 つの計算列ステップで、アナリストは left({postal_code}, 5) という数式を使用して Clean Zip 列を作成し、郵便番号の長さを標準化します。Configure タブには、この計算のプレビューがリアルタイムで表示されます。

別の変換では、アナリストは単純なデータ型の変更を使用して、整数の郵便番号を文字列に変換します。複雑な SQL の CAST 関数や文字列操作が必要だったものが、ビジュアルインターフェースでの数回のクリックで実現できます。

郵便番号が両方のテーブルで一貫性を持つようになったため、アナリストは地域ディメンションテーブルとの結合に成功し、次に customer_id をキーとして顧客ディメンションテーブルとの結合を進めます。

データセットの最終化

データセットをより使いやすくするために、アナリストは Rename columns ステップを使用して、列により説明的な名前を付けます。Quick Sight では、1 つのステップで複数の列の名前を変更できるため、プロセスが効率化されます。Select columns ステップは、列の追加、除外、並べ替えを行うための直感的なインターフェイスを提供します。アナリストは列をドラッグして並べ替えたり、ワンクリックで除外したりできます。

変換を完成させた後、アナリストは 2023 & 2024 Union、Product Join、Calc – Clean Zip、Customer Join のようなユーザーフレンドリーなステップ名を作成し、データ準備プロセスを透明で理解しやすいものにします。その後、アナリストはデータセットを Sales Revenue Dataset として保存して公開し、他のアナリストが活用できるようにします。

次のスクリーンショットは、グローバルアナリストの最終的なワークフローを示しています。

地域アナリストのジャーニー

AnyCompany の米国中部地域のアナリストは、自分の担当地域の前年比売上予測を作成する必要があります。グローバルアナリストがすでに行ったデータ準備作業を再現する代わりに、Sales Revenue Dataset を基盤として使用できます。

作成済データセットに基づく作業

地域アナリストは、新しいデータセットを作成し、Sales Revenue Dataset をソースとして選択することから始めます。このアプローチには大きな利点があります。地域アナリストは、グローバルアナリストが管理する Sales Revenue Dataset の構築に使用されたロジックを理解したり、再作成したりする必要がありません。ソースデータセットへの更新は、地域アナリストの作業に自動的に反映されます。

地域アナリストは、まず Change data type ステップを使用して適切な日付フォーマットを適用し、分析全体で一貫した日付処理を可能にします。

地域データにフォーカス

次に、アナリストは Filter ステップを使用して US-Central リージョンのみに焦点を当て、担当領域のデータセットを素早く絞り込みます。アナリストはまた、2025 年 9 月の最初の数日間の売上データに推定売上 (実際の売上ではない) が含まれていることに気づき、適切なフィルターを適用します。Configure タブは、アナリストが複数のフィルターの条件をプレビューするのに役立ちます。

異なる粒度レベルの処理

アナリストは、フィルタリングされた Sales Revenue Dataset と予測データを結合する必要がありますが、粒度が一致していません。Sales Revenue Dataset には顧客情報が含まれていますが、予測データは製品カテゴリと月のレベルになっています。

Aggregate ステップを使用して、アナリストは ProductZipRegionCategory などのカラムでデータをグループ化し、Sales の合計を計算します。この変換により、複雑な SQL の GROUP BY ステートメントを必要とせずに、予測データに合わせて粒度を調整できます。

列指向の予測データの変換

地域アナリストは別の課題に直面しています。2025 年 9 月から 12 月までの予測データは、月が行ではなく列として格納された Excel ファイルに保存されています。従来の SQL では、これには複雑な UNPIVOT 操作が必要になります。

Quick Sight の Unpivot 変換を使用すると、アナリストは月の列 (2025 年 9 月、10 月、11 月、12 月) を選択し、出力列名を order_datesales として指定するだけで、集計された Sales Revenue Dataset の列名と一致させることができます。この変換により、列指向のデータが即座に行指向の形式に変換され、履歴データと組み合わせることができます。

追加する前に、アナリストは Change data type ステップを使用して、order_date 列を文字列型から日付型に変換し、Sales Revenue Dataset の日付形式との一貫性を保ちます。

履歴データと予測データの結合

両方のデータセットが互換性のある形式になったので、地域アナリストは Append ステップを使用して、2025 年 8 月までの履歴データと 2025 年 9 月から 12 月までの予測データを結合します。ProductCategory などのカラムの順序は 2 つのテーブル間で完全に異なり、カラム数も異なります。Quick Sight は、位置ではなく名前でカラムを自動的に整列させる重い処理を自動的に処理し、Configure タブに適切な出力メッセージを提供します。これにより、カラムの整列と潜在的な不一致を明示的に処理する必要がある複雑な SQL を記述する場合と比較して、アナリストの時間を大幅に節約できます。

その結果、過去の月 (2025 年 8 月以前) の実績値と将来の月 (2025 年 9 月以降) の予測値を含む、年間全体にわたる完全なデータセットが得られます。

次のスクリーンショットは、地域アナリストの最終的なワークフローを示しています。

前年比分析の作成

データの準備が完了したので、地域アナリストは実績データと予測データの両方を含む前年比較を作成できます。Quick Sight の分析機能を使用して、前年と比較した売上のトレンドを示すビジュアライゼーションを作成し、年末までの予測を含めます。これにより、地域チームは SQL の専門知識を必要とせずに、計画とリソース配分のための貴重なインサイトを得ることができます。

メリットと結果

Quick Sight の新しいデータ準備機能により、AnyCompany は大幅な改善を実現しました。

  • 時間の節約 – 以前は数日かかっていたデータ準備タスクが、1 時間未満で完了できるようになりました
  • 技術的な依存関係の削減 – ビジネスアナリストは SQL の専門知識を必要とせずにセルフサービスで作業できます
  • コラボレーションの向上 – グローバルおよび地域のアナリストが互いの作業を基に構築できます
  • インサイト獲得までの時間短縮 – ビジュアルインターフェースにより、アナリストはデータ品質の問題を迅速に特定して解決できます

ステップバイステップのビジュアルインターフェースは、AnyCompany がデータを扱う方法を変革します。以前は複雑な SQL クエリが必要だった作業が、今ではシンプルなクリックで実行できるようになりました。

まとめ

新しい Quick Sight データ準備エクスペリエンスは、データ変換を民主化し、技術的な専門知識がなくても高度な操作を実行できるようにします。AnyCompany の事例が示すように、Append、Join、Unpivot、Aggregate などの機能と、複合データセットを構築する機能を組み合わせることで、アナリストは直感的なビジュアルインターフェースを通じて実際のデータ課題を解決できます。

既存のデータセットを新しい変換のソースとして使用できる機能により、チーム間のコラボレーションが促進され、組織全体での一貫性が容易になります。アナリストのデータ準備の複雑さを排除することで、組織はインサイトを得るまでの時間を短縮できます。

Quick Sight の新しいデータ準備エクスペリエンスを開始するには、Quick Suite アカウントにサインアップしてください。その後、新しいデータセットを作成し、ステップバイステップの変換機能を探索できます。

著者について

Ramon Lopez は、Amazon Quick Sight のプリンシパルソリューションアーキテクトです。BI ソリューションの構築における長年の経験と会計のバックグラウンドを持ち、お客様との協働、ソリューションの創出、世界クラスのサービスの提供に情熱を注いでいます。仕事以外の時間は、海や山でアウトドアを楽しむことを好んでいます。

Vignessh Baskaran は、Amazon Quick Suite の機能である Amazon Quick Sight において、データ接続とデータ準備ドメインを担当するシニアテクニカルプロダクトマネージャーです。ビジネスインテリジェンスとデータウェアハウジングのバックグラウンドを活かし、Quick Sight の新しいデータ準備エクスペリエンスの製品戦略と開発を主導し、複雑なデータ変換をすべてのユーザーがアクセスできるようにすることに注力しています。仕事以外では、クリケット観戦、ラケットボール、シアトルでのさまざまな料理の探索を楽しんでいます。