Amazon Web Services ブログ

VMware Cloud on AWS のデータウェアハウスとビジネスインテリジェンス

AWS で VMware Cloud Global Account Specialist SA Lead を務める David Piet PhD による記事です。

VMware Cloud on AWS は、VMware とアマゾン ウェブ サービス (AWS) が共同で開発したソリューションで、Amazon Elastic Compute Cloud(Amazon EC2)上で vSphere、NSX、vSAN などの VMware の Software-Defined Data Center(SDDC)をマネージドサービスとして提供します。

Amazon Redshift は、最も高速で広く利用されているクラウドデータウェアハウスです。AWS 分析エコシステムとのネイティブな統合により、エンドツーエンドの分析ワークフローをスムーズに処理できます。たとえば、 Amazon QuickSight は、Amazon Redshift データのレポート、視覚化、ダッシュボードの作成に使用できるセッションごとの料金体系を備えた最初のビジネスインテリジェンス (BI) サービスです。

本番ワークロード、または非本番ワークロードでも、データベースコンポーネントを持つことは珍しくありません。時間が経つにつれて、より多くのデータが取り込まれるため、データベースは成長します。そのデータの中にはたくさんの情報が隠されています。

すでに持っているデータをさらに活用するために、ワークロードをどのように向上させればよいでしょうか? 通常、これにはデータベースがパフォーマンスを維持できるように、何らかのデータウェアハウスが必要です。また、操作のためにデータをデータウェアハウスに複製する何らかの方法も必要です。おそらく最も難しい要素は、分析、レポート、視覚化、およびダッシュボードの作成です。

Amazon Redshift のデータを用いて Amazon QuickSight を実行する事により、それらが実現可能となります。

Amazon Redshift を使用すると、標準 SQL と既存の BI ツールを使用して、すべてのデータを迅速かつシンプルかつ費用対効果の高い方法で分析できます。Amazon QuickSight を使用すると、使いやすいクラウドベースのビジネス分析サービスを利用できます。これにより、視覚化の構築、アドホック分析の実行、およびデータ(この場合は Amazon Redshift にあるデータ)からビジネスインサイトを素早く簡単に取得できます。

VMware Cloud on AWS 内でデータベースを実行しているお客様にとって、このパターンは例外ではありません。VMware Cloud on AWS から Amazon Redshift にデータをレプリケートするために、 AWS Database Migration Service(AWS DMS)は、データベースが完全に稼働し、ダウンタイムを最小限に抑えながら、データを迅速かつ安全に移動するための使いやすいツールを提供します。

この投稿では、このソリューションが、VMware Cloud on AWS で実行されているデータベース内にある既存のデータをさらに活用するのにどのように役立つか説明します。また、利用開始にあたって必要な考慮点も順を追って説明します。

ソリューションの概要

図 1 のアーキテクチャ図の左側には、VMware Cloud on AWS SDDC 内でデータベースが実行されています。最終的な目的は、収集しているデータに対して分析を実行し、分析結果のダッシュボードを構築することです。

その目的を達成するために、AWS DMS を使用して VMware Cloud on AWS から Amazon Redshift へのレプリケーションを行います。データが Amazon Redshift に到着したら、QuickSight を BI ツールとして利用します。その間、VMware Cloud on AWSのデータベースとアプリケーションは中断なく実行され続けています。

図 1 — VMware Cloud on AWS と統合されたデータウェアハウスとビジネスインテリジェンス

ワークフローの説明

以上で概要は説明したので、この章ではもう少し深く掘り下げてみましょう。VMware Cloud on AWS は、リソースがシングルテナントで実行されるマネージドサービスです。VMware が管理する AWS アカウントと、VMware が管理する仮想プライベートクラウド (VPC) で構成されます。

VMware Cloud on AWS を使用すると、お客様は、SDDC の作成時に選択した VPC にデプロイされる Elastic Network Interface (ENI) を介して、自分の AWS アカウントで AWS サービスにアクセスできます。

図 2 に示した例には、SDDC で実行されている顧客データベース仮想マシン (VM) が存在しています。この VM は PostgreSQL データベースをホストしており、マーケティングキャンペーンに関するデータを収集し、A/B テストを実施してどちらがより多くのクリックを生み出しているかを判断しています。

データ収集を続けながらも、分析のためには Amazon Redshift にデータをレプリケートしていく必要があります。そのために今回は AWS DMS を利用しますが、SDDC にリンクされている AWS アカウントで ENI を活用することが効率化の鍵となります。この ENI を利用することで、トラフィックを AWS グローバルインフラストラクチャから外側に出すことなく VMware Cloud on AWS SDDC とネイティブ AWS サービス間で高スループットと低レイテンシーの接続が可能になります。

データベース VM と AWS DMS 間の接続を許可するには、VMware Cloud on AWS の NSX-T でファイアウォールルールの許可と、VPC 側で ENI および AWS DMS レプリケーションインスタンスのセキュリティグループの許可の、主に2つを実施する必要があります。

図 2 — SDDC の顧客データベース VM

NSX-T 側から始めて、コンピューティングゲートウェイに 2 つのファイアウォールルールを作成して、データベース仮想マシンと VPC インターフェイスの間でトラフィックが流れるようにします。1 つはインバウンドトラフィック用で、もう 1 つはアウトバウンドトラフィック用です。図 3 は、作成されたルールを示しています。

図 3 — 接続された VPC との間のトラフィックを許可する NSX-T ファイアウォールルール

AWS 側では、レプリケーショントラフィックが SDDC ENI と AWS DMS が使用しているレプリケーションインスタンスの間を流れるように設定します。レプリケーションインスタンスのセキュリティグループが、SDDC ENI に関連付けられたセキュリティグループからデータベースポートへのアクセスを許可する必要があります。

ファイアウォールルールとセキュリティグループを設定したら、図 4 に示すように、データベース VM の AWS DMS 内にエンドポイントを作成します。

AWS DMS エンドポイントが正しく作成されており、SDDC と AWS DMS 間の適切なトラフィックが許可されていることを確認するには、[接続] タブで新しい SDDC エンドポイントへの接続をテストします。これによって、データベース VM に正常に接続できているかを確認できます。

図 4 — データベース VM の AWS DMS エンドポイント

ソースデータベースは VPC 内に存在するため、このアーキテクチャ全体も VPC 内に配置することもできます。セキュリティ上の理由およびトラフィック分離のために、今回はアーキテクチャ全体を VPC 内に配置する構成を採用しています。この構成では、すべてのトラフィックを単一の VPC に分離することができます。

今回 AWS DMS のターゲットとして使用している Amazon Redshift クラスターは、同じ VPC 内に作成、拡張 VPC ルーティングを有効とし、パブリックアクセシビリティは無効としています。同様に、Amazon QuickSight も VPC に接続されています。

VPC 内でワークフローを完結させるために必要な残りの設定は、 Amazon Simple Storage Service (Amazon S3) の VPC エンドポイントへの追加です。これは、AWS DMS がソースデータベースからターゲットデータベースにデータをレプリケートする際に、ターゲットにパブリッシュする前に S3 バケットにデータをステージングするために必要となります。

Amazon Redshift クラスターには VPC 内からのみアクセスできるようにしているので、この VPC エンドポイントは、S3 トラフィックを VPC から外側に出さないようにするために必要となります。

これらの構成が出来上がったら、レプリケーションを開始できます。完了までにかかる時間はコピーするデータの量によって異なりますが、完了すると分析を開始できます。

この例では、どのマーケティングキャンペーンがクリック率を高めるかを A/B テストするために、2 セットのメールをお客様に送信しました。データは Amazon Redshift に格納されているので、 データを表示するダッシュボードを QuickSight で構築できます。

今回は、米国の地図上に結果を配置しています。特定の結果を州別に拡大するには、その州 (この例では California) をクリックしてデータを表示します。データがあれば、可能性は無限大です。

図 5 — 米国 (上) とカリフォルニア (下) の A/B テストデータを表示する Amazon QuickSight ダッシュボード

まとめ

VMware Cloud on AWS の最大の利点の 1 つは、他の AWS サービスと容易に統合できることです。これにより、お客様は数え切れないほど多くの選択肢でワークロード全体を向上できます。

長期にわたってデータベースにデータを蓄積し、そこから新しい洞察を収集する新しい方法を探している場合、Amazon Redshift と Amazon QuickSight を使用すると簡単で手軽に実現できます。

リファレンスアーキテクチャ、動画の概要、ソリューション概要など、VMware Cloud on AWS の詳細については、これらのリソースをご覧ください。

より多くの情報をお探しの場合、あるいはを今回ご紹介したような構成をお客様の環境に実装するために AWS と連絡を取りたい場合は、AWS 担当営業もしくはこちらからご連絡ください

翻訳は Specialist SA 武田が担当しました。原文はこちらです。