メインコンテンツに移動

機械学習開発と運用のための Amazon SageMaker 利用構成と料金試算例

構成概要

目的・用途:
既存のアプリケーションに機械学習を導入することでビジネスプロセスを高度化効率化したい

この構成での料金試算例:
4,377.20 ドル(月額)

  • 既存のアプリケーションの新機能として機械学習の導入
  • データサイエンティストは 5 名在籍し、それぞれに Amazon SageMaker ノートブックインスタンスを提供し、モデル開発を行います
  • トレーニング用データは Amazon S3 に保存されており、Amazon SageMaker Processing を利用し、データの前処理を行います
  • 機械学習ワークロードは、ML ワークロード(Scikit-Learn,XGBoostなど)とディープラーニングワークロード(Pytorch,Tesorflowなど)の 2 つ存在し、それぞれのモデルの学習時間の割合は  95%と 5%とします
  • 作成したモデルは ML ワークロード、ディープラーニングワークロードともにデプロイし、Amazon SageMaker ホスティングサービスにて常時稼働とします

Amazon SageMaker を利用して既存のビジネスピロセスの中に機械学習のインサイトを構築する例です。

Amazon SageMaker は、完全マネージド型の ML (Machine Learning/機械学習) サービスであり、大規模なモデルの構築、トレーニング、チューニング、デプロイを可能にします。コンピュータティングリソースとシステムソフトウェアのプロビジョニング、インフラストラクチャと運用の管理が不要になるため、お客様はビジネス上の問題に集中し、 新しいモデリング手法で開発を行い、アイデアから本番環境に至るまで MLプロジェクトを迅速に進めることができます。

Architecture diagram in Japanese showing the Amazon SageMaker machine learning workflow including data processing, model development, training, and deployment in AWS Cloud with integration to Amazon EC2 and AWS Lambda.

この構成での選択サービス

用途
選択サービス
データストレージ
Jupyter ノートブック

Amazon SageMaker ノートブックインスタンス

データの前処理

Amazon SageMaker Processing

モデルのトレーニング

Amazon SageMaker トレーニングジョブ

モデルのデプロイ

Amazon SageMaker ホスティングサービス

月額合計料金:4,377.20(USD)

この構成での料金試算例

サービス
項目
数量
単価
料金 (USD)
Amazon S3

データストレージ

70 GB(*1)

0.025 USD/GB

1.75

Amazon SageMaker ノートブックインスタンス

ノートブックインスタンス

ML ストレージ

3,600 時間(*2)

25 GB(*3)

0.065 USD/時間

0.168 USD/GB

237.25

4.20

Amazon SageMaker Processing

Processing インスタンス

ML ストレージ

30 時間(*4)

2.5 GB(*5)

0.298 USD/時間

0.168 USD/GB

8.94

0.42

Amazon SageMaker トレーニングジョブ(ML)

トレーニングインスタンス

ML ストレージ

30 時間(*6)

2.5 GB(*8)

2.275 USD/時間(*7)

0.168 USD/GB

68.25

4.20

Amazon SageMaker ホスティングサービス

ホスティングインスタンス

ML ストレージ

1,460 時間(*9)

38 GB(*11)

0.298 USD/時間 (730 時間)
5.242 USD/時間 (730 時間)
(*10)

0.168 USD/GB

4,044.20

6.39

その他

データ処理量(入力/出力)

100 GB(*12)

 0.016 USB/GB

1.60

  • 東京リージョンのご利用を想定しています。


1. 60 GB(トレーニング用データ) + 10 GB(モデル等) = 70 GB で計算しています。
2. ノートブックインスタンスタイプとして ml.t3.medium、稼働時間として 730 時間 * 5 インスタンス = 3,650 時間で計算しています。
3. ノートブックインスタンスのストレージとして、5 GB * 5 インスタンス = 25 GB で計算しています。
4. Processing インスタンスタイプとして ml.m5.xlarge、ジョブ実行時間として 1 日平均 1 時間(1 ヶ月あたり合計 30 時間)で計算しています。
5. Processing インスタンスのストレージとして、 60 GB * 30 時間 / 730 時間 ≒ 2.5 GB を月の利用量として計算しています。
6. トレーニングの実行時間は、1 日平均 1 時間(1 ヶ月あたり合計 30 時間)で計算しています。
7. トレーニングの割合は、ML ワークロード(Scikit-Learn,XGBoostなど)が 60%、ディープラーニングワークロード (PyTorch,Tensorflowなど) が 40%と想定しています。トレーニングインスタンスタイプは、ML ワークロードでは ml.m5.xlarge(0.298 USD/時間)、ディープラーニングワークロードでは ml.p3.2xlarge(5.872 USD/時間)と想定しており、時間単価は 0.298 USD * 0.6 + 5.242 USD * 0.4 = 2.275 USD として計算しています。
8. トレーニングインスタンスのストレージとして、 60 GB * 30時間 / 730 時間 ≒ 2.5 GB を月の利用量として計算しています。
9. ホスティングインスタンスとして、ML ワークロードとして 1 つ、ディープラーニングワークロードとして 1 つ、合計 2 つのモデルをデプロイし、稼働時間として 730 時間 * 2 インスタンス = 1,460 時間で計算しています。
10. ML ワークロード用ホスティングインスタンスとして ml.m5.xlarge(0.298 USD/時間)、ディープラーニングワークロード用ホスティングインスタンスとして ml.p3.2xlarge(5.872 USD/時間)をそれぞれ 730 時間利用します。
11. ホスティングインスタンス用ストレージとして、ml.m5.xlarge 8 GB と ml.p3.2xlarge 30 GB の合計 38 GB で計算しています。
12. データ処理量として、入力 50 GB、出力 50 GB の合計 100 GB で計算しています。

※ 2024 年 3 月 6 日時点での試算です