Amazon Web Services ブログ

Amazon SageMaker Unified Studio と Tableau、Power BI などの統合で分析を強化

本記事は 2026 年 1 月 22 日 に公開された「Power up your analytics with Amazon SageMaker Unified Studio integration with Tableau, Power BI, and more」を翻訳したものです。

複数のデータソースにまたがるガバナンスされたデータに、セキュリティとガバナンスを維持しながら、使い慣れたビジネスインテリジェンス (BI) や分析ツールでアクセスして分析する際、組織は新たな課題に直面します。Tableau、Power BI、Excel などの使い慣れたツールを Amazon SageMaker のデータアセットに、データガバナンスとセキュリティ機能を損なうことなくシームレスに接続する必要があります。Amazon SageMaker は Amazon Athena JDBC ドライバーによる認証をサポートしており、データユーザーは Tableau、Power BI、Excel、SQL Workbench、DBeaver などの一般的な BI および分析ツールを使い、サブスクライブしたデータレイクアセットにクエリできます。データユーザーは使い慣れたツールで Amazon SageMaker の管理化にあるデータにアクセスして分析でき、生産性と柔軟性が向上します。 Amazon SageMaker Unified Studio では、データユーザーが単一のプロジェクト内で複数のソースからデータを検索してサブスクライブでき、データアクセスとガバナンスが効率化されます。Amazon SageMaker Unified Studio は Amazon AthenaAmazon RedshiftAmazon SageMaker AI などの Amazon 固有のオプションとネイティブに統合されており、ユーザーはプロジェクトのガバナンスされたデータを分析できます。これらに加え、今回の JDBC 接続のリリースにより、Amazon SageMaker Unified Studio はアナリストやサイエンティストを含むデータユーザーへのサポートを拡大し、SQL Workbench、Domino、 Amazon Athena などの Amazon ネイティブソリューションなど、好みのツールで作業しながら、Amazon SageMaker Unified Studio 内で安全でガバナンスされたアクセスを確保できます。

はじめに

まず、使用するツール向けの最新の Athena JDBC ドライバーをダウンロードしてインストールします。インストール後、Amazon SageMaker Unified Studio ポータルから JDBC 接続文字列をコピーして JDBC 接続設定に貼り付け、ツールからの接続を確立します。企業の認証情報を使ったシングルサインオン (SSO) で認証するよう指示されます。接続後、Amazon SageMaker Unified Studio でガバナンスされたデータを、既に使い慣れた信頼できるツール内でクエリ、可視化、共有できます。

本記事では、Athena JDBC ドライバーで各種分析ツールを Amazon SageMaker Unified Studio に接続し、Amazon SageMaker Unified Studio プロジェクト内でサブスクライブしたデータにシームレスにアクセスする手順を説明します。

ソリューション概要

マーケティングチーム(Marketing Team)が店舗別および営業担当者別の売上パターンを理解するために売上データを分析したいというユースケースで、これらの機能を実証します。マーケティングチームは営業チーム(Sales Team)が所有する sales_performance_by_store と sales_performance_by_rep のデータにアクセスする必要があります。データプロデューサーとして機能する営業チームは、必要なデータアセットを公開して Amazon SageMaker Unified Studio に登録し、コンシューマーであるマーケティングチームがこれらのアセットを検索してサブスクライブできるようにします。

サブスクリプションが承認されると、データアセットは Amazon SageMaker Unified Studio のマーケティングチームのプロジェクト環境内で利用可能になります。マーケティングチームは好みのツールでデータ探索を実行できます。DBeaver を使ったアーキテクチャ例を次の図に示します。

SageMaker Unified Studio project architecture diagram showing data collaboration between Sales and Marketing teams with Amazon S3 storage and Athena integration

前提条件

本記事の手順を実行するには、次の前提条件が必要です。

  1. AWS アカウント – アクティブな AWS アカウントをお持ちでない場合は、新しい AWS アカウントを作成してアクティブ化する方法を参照してください。
  2. Amazon SageMaker リソース – Amazon SageMaker のドメインと 2 つの Amazon SageMaker プロジェクトが必要です。(訳注:マーケティングチームと、営業チームがそれぞれ別のプロジェクトに所属するため)
  3. データアセットの公開 – 営業チームのデータプロデューサーとして、個々のデータアセットを Amazon SageMaker Unified Studio に取り込めます。本ユースケースでは、データソースを作成し、AWS Glue Data Catalog から sales_performance_by_store と sales_performance_by_rep という 2 つのデータアセットの技術メタデータをインポートします。データアセットにビジネス説明を追加してカタログに公開してください。注: ここでは Glue カタログ内のテーブルを使用していますが、SageMaker Lakehouse では他のソースからアセットを取り込むオプションもあります。
  4. データアセットのサブスクライブ – マーケティングチームのデータアナリストとして、データアセットを検索してサブスクライブできます。営業チームのデータプロデューサーがサブスクリプションをレビューして承認します。正常に完了すると、データアセットが SageMaker プロジェクトに追加されます。

公開とサブスクライブの詳細な手順については、Amazon SageMaker Unified Studio ユーザーガイドを参照してください。

次の図は、マーケティングプロジェクトにあるカタログのサブスクライブ済みアセットセクションを示しています。

SageMaker Unified Studio Assets page displaying subscribed data assets with accessibility status indicators

次のセクションでは、Amazon SageMaker Unified Studio からサブスクライブ済みアセットを利用するための DBeaver の設定手順を説明します。

サブスクライブ済みデータアセットにアクセスするための DBeaver の設定

本セクションでは、Marketing プロジェクトからサブスクライブ済みアセットにアクセスするための DBeaver の設定を行います。

DBeaver を設定する方法:

  1. JDBC で接続: Amazon SageMaker Unified Studio で、(1) Marketing プロジェクトを開き、(2) Project overview 画面で、(3) JDBC connection details タブを選択します。SageMaker Unified Studio Project overview page showing JDBC connection parameters for external application integration
  2. JDBC 接続 URL をテキストエディタにコピーします。URL には、DBeaver でデータベース接続を設定するために必要な次のパラメータが含まれています – Domain ID、Environment ID、Region、IDC Issuer URL。JDBC connection details configuration panel with IDC authentication parameters and copy functionality
  3. 最新の Athena ドライバーをダウンロードしてインストールします。
    • DBeaver に Athena ドライバーがプリインストールされている場合、古い (v2) バージョンの可能性があります。Amazon SageMaker Unified Studio との互換性を確保するには、必要な認証機能を含む最新のドライバー (v3) が必要です。
    • 最新の JDBC ドライバー—バージョン 3.x をダウンロードします。
    • 最新のドライバーをインストールするには:
      • DBeaver で Database から Driver Manager に移動します。
      • Athena ドライバーを選択して Edit を選択します。
      • Libraries タブを開きます。
      • Download/Update を選択して最新のドライバーバージョンを取得します。
      • プロンプトが表示されたら、適切なバージョンを選択してダウンロードを確認します。
  4. DBeaver SQL クライアントで、新しいデータベース接続を作成し、Athena ドライバーを選択します。DBeaver database connection dialog showing Amazon Athena driver selection among available database options
  5. Driver Properties タブに切り替え、Amazon SageMaker Unified Studio からコピーした JDBC 接続 URL に含まれる次のプロパティの値を入力します。これらのプロパティがまだ存在しない場合は、追加してそれぞれの値を指定できます。
    • CredentialsProvider: AWS へのリクエストを認証するための認証情報プロバイダー
    • DataZoneDomainId: Amazon DataZone ドメインの ID
    • DataZoneDomainRegion: ドメインがホストされている AWS リージョン
    • DataZoneEnvironmentId: DefaultDataLake 環境の ID
    • IdentityCenterIssuerUrl: トークン発行のために AWS Identity and Access Management (IAM) Identity Center が使用する発行者 URL
    • OutputLocation: クエリ結果を保存するための Amazon S3 パス
    • Region: 環境が作成されたリージョン
    • Workgroup: 環境の Amazon Athena ワークグループ
    • ListenPort: 任意の 4 桁のポート番号を選択します。これは IAM Identity Center レスポンスをリッスンするポート番号です

    DBeaver connection configuration dialog for Amazon Athena with driver properties and authentication settings

  6. Test Connection… を選択します。
  7. IAM Identity Center サインインポータルにリダイレクトされます。Marketing ユーザーの認証情報でサインインします。シングルサインオン (SSO) で既にサインインしている場合、この手順はスキップできます。AWS authentication sign-in page with username input field
  8. サインイン後、DataZoneAuthPlugin の承認を求められた場合は、Allow access を選択して DBeaver から Amazon DataZone へのアクセスを承認します。AWS DataZone authorization dialog requesting user permission for application access
  9. サインインが完了すると、次のメッセージが表示されます。ウィンドウを閉じて DBeaver に戻ります。Amazon DataZone session completion confirmation message
  10. 接続が確立されると、次の成功メッセージが表示されます。DBeaver connection test dialog showing successful Amazon Athena connection with performance metrics
  11. これで、DBeaver 内でサブスクライブ済みアセットをすべて表示してクエリできます。DBeaver SQL query interface displaying sales performance data from Amazon Athena database

これらの手順は、JDBC 接続をサポートする他の分析ツールやクライアントにも適用できます。別のツールを使用している場合は、Amazon SageMaker Unified Studio データアセットへの適切な設定とアクセスを確保するために、これらの手順を適宜調整して利用してください。

他のアプリケーションとの統合

標準的なデータベース接続をサポートする他の BI および分析ツールでも同様の手順を使用できます。

Tableau Desktop への接続

Athena JDBC ドライバーを使用して Tableau を Amazon SageMaker Unified Studio に接続し、サブスクライブ済みデータを可視化します。

Tableau Desktop に接続する方法:

  1. 最新の Athena JDBC 3.x ドライバーを使用していることを確認します。
  2. JDBC ドライバーファイルをコピーして、オペレーティングシステムに応じた適切なフォルダに配置します。
    • Mac OS の場合: ~/Library/Tableau/Drivers
    • Windows の場合: C:\Program Files\Tableau\Drivers
  3. Tableau Desktop を開きます。To a Server 接続メニューから Other Databases (JDBC) を選択して Amazon SageMaker Unified Studio に接続します。Tableau start page showing connection options with Other Databases JDBC option highlighted
  4. SageMaker Unified Studio ポータルからコピーした JDBC 接続 URL を URL に貼り付けます。DialectUsernamePassword などの他のフィールドは空白のままにして、Sign in を選択します。ポートが占有されているというエラーが表示された場合は、URL に “;ListenPort=8055” を追加してポートを変更します。任意のポート番号を使用できます。
    Tableau Other Databases JDBC connection dialog with PostgreSQL dialect configuration
  5. IAM Identity Center で認証するようリダイレクトされます。SageMaker Unified Studio ポータルへのサインインに使用した Identity Center ユーザーの認証情報を入力します。DataZoneAuthPlugin が Tableau から Amazon DataZone にアクセスすることを承認します。接続が成功メッセージとともに確立されると、プロジェクトのサブスクライブ済みデータを Tableau 内で直接表示してダッシュボードを構築できます。Data analytics interface showing sales_performance_by_store table with 283 rows and 15 fields

Microsoft Power BI への接続

次に、Windows 上で Amazon SageMaker Unified Studio を Microsoft Power BI に接続する方法を説明します。Amazon Athena は Microsoft Power BI などの ODBC 互換ツールに接続するためのネイティブ ODBC ドライバーを提供していますが、現在 Amazon SageMaker Unified Studio 認証をサポートしていません。そのため、本記事では ODBC-JDBC ブリッジを使用して、SageMaker Unified Studio 認証をサポートする Athena JDBC ドライバーで Amazon SageMaker Unified Studio を Microsoft Power BI に接続します。

本記事では、ODBC-JDBC ブリッジとして ZappySys ドライバーを使用しています。別途ライセンス料が必要なサードパーティソリューションであり、AWS ソリューションには含まれていません。ODBC-JDBC ブリッジには他のソリューションを選択することもできます。Power BI に接続するには:

  1. ODBC Data Source Administrator を実行するためには、管理者権限が必要です。
  2. Windows のスタートメニューから、管理者として実行を使用して ODBC Data Source Administrator (64 ビット版) を実行します。
  3. ZappySys JDBC Bridge Driver で新しいデータソースを作成します。接続の詳細を入力するよう求められます。Windows ODBC Data Source Administrator dialog showing ZappySys JDBC Bridge Driver selection
  4. SageMaker Unified Studio ポータルからコピーした JDBC URL を、ドライバークラスと JDBC ドライバーファイルとともに Connection String に貼り付けます。最新の Athena JDBC 3.x ドライバーを使用していることを確認します。
  5. Test Connection を選択します。接続が成功すると、新しいダイアログウィンドウがポップアップ表示されます。Test Connection using ZappySys JDBC Bridge Driver
  6. IAM Identity Center で認証するようリダイレクトされます。SageMaker Unified Studio ポータルへのサインインに使用した Identity Center ユーザーの認証情報を入力します。DataZoneAuthPlugin を承認します。
  7. ZappySys JDBC Bridge Driver ウィンドウで Preview タブを選択し、サブスクライブ済みテーブルの 1 つを選択してデータにアクセスします。ZappySys JDBC Bridge Driver configuration interface showing SQL query preview with sales performance results
  8. データソースの設定後、Power BI を起動します。空白のレポートを作成するか、既存のレポートを使用して新しいビジュアルを統合します。Get Data を選択し、作成したデータソースの名前を選択します。新しいブラウザウィンドウが開き、認証情報を認証します。DataZone Auth プラグインを承認するためにアクセスを許可します。承認が完了すると、サブスクライブ済みデータアセットを使って Microsoft Power BI でレポートを作成できます。Database connection profile selection dialog with PostgreSQL group highlighted

SQL Workbench への接続

SQL インターフェイスで Amazon SageMaker Unified Studio のプロジェクトを通じてサブスクライブしたデータレイクテーブルとビューをクエリしたいユーザー向けに、SQL Workbench を Amazon SageMaker Unified Studio に接続する方法を説明します。

SQL Workbench に接続するには:

  1. 最新の Athena JDBC 3.x ドライバーを使用していることを確認します。
  2. SQL Workbench/J を開き、Manage Drivers を選択します。Database driver management interface showing SMUSAthenajDBC driver configuration details
  3. 新しいドライバーを追加するオプションを選択します。SMUSAthenaJDBC などの名前を入力し、前の手順でダウンロードしたドライバーをインポートします。Database driver management dialog showing SMUSAthenaJDBC driver configuration with library path and class name
  4. 新しい接続プロファイルを作成し、smus-profile などの名前を付けます。Driver ドロップダウンで、設定したドライバーを選択します。URL には、jdbc:athena://region=us-east-1; という文字列を入力します (この例では、バージニアリージョンを使用しています)。Extended Properties を選択します。PostgreSQL connection profile configuration dialog with Amazon Athena JDBC driver settings and authentication options
  5. Extended Properties で、SageMaker Unified Studio ポータルからコピーした次のパラメータを追加します。これらのパラメータは JDBC (URL) 接続文字列に含めることもできます。OK を選択します。
    • Workgroup
    • OutputLocation
    • DataZoneDomainId
    • IdentityCenterIssuerURL
    • CredentialsProvider
    • DatazoneEnvironmentId
    • DataZoneDomainRegain

    また、任意のポート番号で “ListenPort” を追加します。

    Extended properties configuration dialog showing AWS DataZone connection parameters including domain ID, environment ID, and listen port 8067

  6. IAM Identity Center で認証するようリダイレクトされます。SageMaker Unified Studio ポータルへのサインインに使用した Identity Center ユーザーの認証情報を入力します。DataZoneAuthPlugin を承認します。
  7. 接続が成功したら、SQL Workbench/J の Database Explorer で、SageMaker unified studio のマーケティングプロジェクトからデータベースを選択します。サブスクライブ済みテーブルを選択します。Data タブを選択して、テーブル内のデータを表示します。SQL Workbench showing sales performance data query results from AWS Athena database with 283 customer transaction records

クリーンアップ

テスト後に追加料金が発生しないようにするには、Amazon SageMaker Unified Studio ドメインを削除してください。手順については、ドメインの削除を参照してください。

まとめ

Amazon SageMaker Unified Studio は機能を増やし続けており、サブスクライブ済みデータへのアクセス、分析、可視化においてより高い柔軟性を提供します。Athena JDBC ドライバーのサポートにより、幅広い一般的な BI および分析ツールを使用できるようになり、Amazon SageMaker Unified Studio を通じてアクセスするデータがこれまで以上に利用しやすくなりました。Tableau、Power BI、その他の使い慣れたツールのいずれを使用する場合でも、Amazon SageMaker Unified Studio との統合により、データは安全に保たれ、承認されたユーザーがアクセスできます。

本機能は、Amazon SageMaker Unified Studio が現在利用可能なすべての AWS 商用リージョンでサポートされています。技術ドキュメントの確認から始めましょう。

著者について

Narendra Gupta

Narendra Gupta

Narendra は、AWS の Specialist Solutions Architect で、AWS 分析サービスに重点を置いてお客様のクラウドジャーニーを支援しています。仕事以外では、新しいテクノロジーの学習、映画鑑賞、新しい場所への訪問を楽しんでいます。

Durga Mishra

Durga Mishra

Durga は、AWS の Solutions Architect です。仕事以外では、家族と過ごす時間を楽しみ、アパラチアントレイルでのハイキングや自然の中で過ごすことを愛しています。

Ramesh Singh

Ramesh Singh

Ramesh は、ワシントン州シアトルの AWS で Senior Product Manager Technical (External Services) を務めており、現在は Amazon SageMaker チームに所属しています。最先端テクノロジーを使用してエンタープライズのお客様が重要な目標を達成できるよう支援する、高性能な ML/AI および分析製品の構築に情熱を注いでいます。

Nishchai JM

Nishchai JM

Nishchai は、Amazon Web Services の Analytics Specialist Solutions Architect です。ビッグデータアプリケーションの構築を専門とし、お客様のクラウド上でのアプリケーションモダナイゼーションを支援しています。データは新しい石油であると考えており、データから洞察を引き出すことに時間の大半を費やしています。


この記事は Kiro が翻訳を担当し、Solutions Architect の 下佐粉 昭 (Akira Shimosako) がレビューしました。