メインコンテンツに移動
  • 料金
  • クラウド構成と料金試算例 TOP

データレイクにあるデータを使った分析環境を構築したい

オンプレミスにある EC システムなどに保存されている各種データ (売上・販売データ、顧客からの商品レビュー) を、データレイクのストレージとして活用する Amazon S3 に転送・蓄積し、データレイクに蓄積したデータを活用して、売上推移の可視化や販売チャネルの分析、各商品に対するレビュー分析を実現する構成例とその概算料金をご紹介します

構成概要

この構成例のクラウドレベル:

応用編

入門編:該当するユースケースの知識が全くない方が対象
基礎編:該当するユースケースの入門知識がある方が対象
応用編:該当するユースケースにある程度精通している方が対象

この構成例で解決できる課題・困りごと:

  • クラウドにデータを移行し、管理や分析を効率化したい

  • データを迅速に分析し、可視化することで意思決定を加速させたい

  • データの一元管理とセキュリティを強化し、コンプライアンスを確保したい

この構成例の概算料金:

266.92 ドル (月額)

この構成例のメリット:

  • マネージドの ETLや BI サービスの利用により、運用コストを軽減できます

  • データ分析に標準 SQL が使用できるインフラストラクチャで、分析プロセスの一貫性と効率性が向上します

  • BI サービスのライセンスコストが課題である場合、アクセス頻度に応じた従量課金によってコスト効率を高めます

  • データレイクに対して、直接 SQL を使ってアドホックに分析できます

Missing alt text value

月額合計料金:266.92 (USD)

この構成例で使用したサービスと概算料金内訳

サービス
項目
数量
単価
料金 (USD)
Amazon S3

標準ストレージ

PUT リクエスト

GET リクエスト

((200 MB * 50 ファイル/日 [Source]) + (100 MB * 100 ファイル/日 [Destination])) * 30 日/月 = 600 GB/月

(50 ファイル/日 [Source] + 100 ファイル/日 [Destination]) * 30 日 = 4,500 ファイル

(50 ファイル/日 [Source] + 100 ファイル/日 [Destination]) * 30 日 = 4,500 ファイル

0.025 USD/GB

0.0047 USD/1,000 リクエスト

0.00037 USD/1,000 リクエスト

15

0.02115

0.00167

AWS Glue

ETL Apache Spark ジョブ

クローラ

Data Catalog ストレージ

Data Catalog リクエスト

6 DPU(最低 2 DPU から) * 30 分/日 * 30 日 = 90 DPU・時間

4 DPU * 30 分/日 * 30 日 = 60 DPU・時間

200 万オブジェクト/月

200 万アクセス/月

DPU あたり 0.44 USD/時間 (最小 1 分)

DPU あたり 0.44 USD/時間 (最小 10 分)

100 万個を超えると 1.00 USD/10 万個
(最初の 100 万オブジェクトは無料)

100 万リクエストを超えると 1.00 USD/100 万リクエスト
(最初の 100 万リクエストは無料)

39.6

26.4

10

1

Amazon Athena

スキャンされたデータ

10 GB/日 * 30 日 = 300 GB

5.00 USD/TB

1.5

Amazon QuickSight

作成者

リーダー

SPICE ストレージ

3 ユーザー

30 ユーザー

30 GB
(作成者ごとに 10 GB が割り当てられているため、課金対象は 30 GB です)

24 USD/ユーザー
(1ヶ月契約。年間契約の場合、18 USD/ユーザー/月)

3 USD/ユーザー/月

0.38 USD/月
(作成者あたり 10 GB の SPICE 割り当てが含まれています)

72

90

11.4

  • 東京リージョンでの利用を想定しています。

  • 1 ヶ月を 30 日として計算しています。

  • オンプレの各種システムから、毎日 200 ファイル、各々 50 MB のデータファイル が生成されます。

  • データファイルは、 AWS CLI を使って S3 バケット [Source] へアップロードします。

  • 実行される Glue Job により、S3 バケット [Source] にアップロードされた 200 ファイル50MB を、 100 ファイル 100 MBに変換し、 S3 バケット [Destination] へ格納します。

  • Glue Job が終了したら、Crawler を実行しテーブルやパーティションなどのメタデータを、AWS Glue Data Catalog に更新します。

  • Athena クエリエンジンが Glue Data Catalog にあるメタデータを参照して、 S3 バケット [Destination] にあるデータの検索、読み取り、および処理を行います。

  • Glue Data Catalog には、 Glue テーブルやデータベースなどのオブジェクトが 200 万個/月作成され、オブジェクトへは 200 万アクセス/月あるものとします。

  • Athena からクエリを実行するたびに、 S3 バケット [Destination] 内の 10 GB 分のファイルを読み取って処理を行います

  • QuickSight はエンタープライズ・エディションを利用します。

  • Athena クエリのデータ処理結果を QuickSight の SPICE に日次で増分更新します。

  • 3 名が作成者ユーザー 、 30 名がリーダーユーザーとして、 QuickSight を利用します。

  • SPICE は作成者ごとに、20 GB を消費します。

※ 2024 年 09 月 16 日時点での試算です