リファレンスデプロイ

AWS でのデータレイク基盤

Amazon Redshift、Amazon Kinesis、AWS Glue、Amazon SageMaker などの AWS のサービスの使用

このソリューションでは、Amazon Simple Storage Service (Amazon S3)、Amazon Redshift、Amazon Kinesis、Amazon Athena、AWS Glue、Amazon Elasticsearch Service (Amazon ES)、Amazon SageMaker、Amazon QuickSight などの Amazon Web Services (AWS) のサービスと統合するデータレイクの基盤をデプロイします。

データレイクの基盤では、これらの AWS のサービスを使用し、データ送信、取り込み処理、データセット管理、データ変換と分析、機械学習ツールの構築とデプロイ、検索、公開、可視化などの機能を提供します。この基盤が設けられると、ISV および SaaS ツールを使用してデータレイクを強化できるようになります。

このリファレンスアーキテクチャは AWS CloudFormation テンプレートによって自動化され、このテンプレートは要件を満たすようにカスタマイズできます。

このソリューションは AWS によって開発されました。

  •  構築するもの
  • このソリューションでは次を設定します。

    • 2 つのアベイラビリティーゾーンにまたがり、2 つのパブリックサブネットと 2 つのプライベートサブネットを含む仮想プライベートクラウド (VPC)。*
    • インターネットへのアクセスを提供するインターネットゲートウェイ。*
    • パブリックサブネットに配置される、マネージド NAT ゲートウェイ。プライベートサブネット内のリソースへのアウトバウンドのインターネットアクセスを提供します。*
    • パブリックサブネットの Auto Scaling グループに含まれる Linux 踏み台ホスト。パブリックサブネットおよびプライベートサブネット内の EC2 インスタンスへのインバウンドのセキュアシェル (SSH) アクセスを許可します。*
    • AWS リソースへのアクセス許可を提供する AWS Identity and Access Management (IAM) ロール。例えば、キュレートされたデータセットに対して Amazon Redshift と Amazon Athena から読み書きできるようになります。
    • プライベートサブネットに配置される、データ集約、分析、変換、新規にキュレートおよび公開されるデータセットの作成のための Amazon Redshift。
    • AWS 認証を使用してアクセスできる Amazon SageMaker インスタンス。
    • Amazon S3、Amazon Athena、AWS Glue、AWS Lambda、Amazon ES with Kibana、Amazon Kinesis、Amazon QuickSight など、他の Amazon サービスとの統合。

    * ソリューションを既存の VPC にデプロイするテンプレートは、アスタリスクが付けられたタスクをスキップし、既存の VPC 設定にユーザーを誘導します。

  •  デプロイ方法
  • デプロイガイドの指示に従って、このソリューションをデプロイします。これにはこれらのステップが含まれます。

    1. AWS アカウントにサインインします。AWS アカウントをお持ちでない場合は、https://aws.amazon.com でサインアップしてください。
    2. ソリューションを起動します。スタックのデプロイには、約 50 分かかります。スタックを作成する前に、上部のツールバーから AWS リージョンを選択します。以下のいずれかのオプションを選択してください。
    3. ソリューションで作成したリソースを確認してデプロイをテストします。

    ソリューションにはカスタマイズ可能なパラメータが用意されています。例えば、ネットワークを設定したり、Amazon Redshift、Kinesis、Elasticsearch の設定をカスタマイズしたりできます。 

    Amazon は、本ソリューションで AWS と協力した AWS パートナーとユーザーデプロイ情報を共有する場合があります。  

  •  コストとライセンス
  • このソリューションの実行中に使用した AWS のサービスおよびサードパーティーライセンスのコストは、お客様のご負担となります。このソリューションを使用しても追加コストは発生しません。

    このソリューションには、カスタマイズ可能な設定パラメータが含まれています。インスタンスタイプなどの設定の一部は、デプロイにかかるコストに影響します。料金の見積もりについては、利用する AWS の各サービスの料金ページを参照してください。料金は変更される場合があります。

    ヒント: ソリューションをデプロイした後、 AWS Cost and Usage Report を作成し、関連するコストを追跡します。これらのレポートは、お客様のアカウントでの Amazon Simple Storage Service (Amazon S3) バケットへの請求メトリクスを提供します。毎月の使用量に基づいてコストを見積もり、月末のデータを集計します。詳細については、 AWS Cost and Usage Report とはを参照してください。
  •  リソース
  • このソリューションは、ソリューションスペースで紹介されているソリューションに関連しています。これには、概要、AWS コンピテンシーパートナーが作成したコンサルティングオファーのオプション、概念実証 (PoC) プロジェクトでの AWS の共同投資が含まれます。詳細については、ソリューションスペースを参照してください。