構成概要
目的・用途:
既存のアプリケーションに機械学習を導入することでビジネスプロセスを高度化効率化したい
この構成での料金試算例:
4,377.20 ドル(月額)
- 既存のアプリケーションの新機能として機械学習の導入
- データサイエンティストは 5 名在籍し、それぞれに Amazon SageMaker ノートブックインスタンスを提供し、モデル開発を行います
- トレーニング用データは Amazon S3 に保存されており、Amazon SageMaker Processing を利用し、データの前処理を行います
- 機械学習ワークロードは、ML ワークロード(Scikit-Learn,XGBoostなど)とディープラーニングワークロード(Pytorch,Tesorflowなど)の 2 つ存在し、それぞれのモデルの学習時間の割合は 95%と 5%とします
- 作成したモデルは ML ワークロード、ディープラーニングワークロードともにデプロイし、Amazon SageMaker ホスティングサービスにて常時稼働とします
Amazon SageMaker を利用して既存のビジネスピロセスの中に機械学習のインサイトを構築する例です。
Amazon SageMaker は、完全マネージド型の ML (Machine Learning/機械学習) サービスであり、大規模なモデルの構築、トレーニング、チューニング、デプロイを可能にします。コンピュータティングリソースとシステムソフトウェアのプロビジョニング、インフラストラクチャと運用の管理が不要になるため、お客様はビジネス上の問題に集中し、 新しいモデリング手法で開発を行い、アイデアから本番環境に至るまで MLプロジェクトを迅速に進めることができます。

この構成での選択サービス
用途
|
選択サービス
|
---|---|
データストレージ
|
|
Jupyter ノートブック
|
Amazon SageMaker ノートブックインスタンス |
データの前処理
|
Amazon SageMaker Processing |
モデルのトレーニング
|
Amazon SageMaker トレーニングジョブ |
モデルのデプロイ
|
Amazon SageMaker ホスティングサービス |
月額合計料金:4,377.20(USD)
この構成での料金試算例
サービス
|
項目
|
数量
|
単価
|
料金 (USD)
|
||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Amazon S3
|
データストレージ |
70 GB(*1) |
0.025 USD/GB |
1.75 |
||||||||
Amazon SageMaker ノートブックインスタンス
|
|
|
|
|
||||||||
Amazon SageMaker Processing
|
|
|
|
|
||||||||
Amazon SageMaker トレーニングジョブ(ML)
|
|
|
|
|
||||||||
Amazon SageMaker ホスティングサービス
|
|
|
|
|
||||||||
その他
|
データ処理量(入力/出力) |
100 GB(*12) |
0.016 USB/GB |
1.60 |
東京リージョンのご利用を想定しています。
1. 60 GB(トレーニング用データ) + 10 GB(モデル等) = 70 GB で計算しています。
2. ノートブックインスタンスタイプとして ml.t3.medium、稼働時間として 730 時間 * 5 インスタンス = 3,650 時間で計算しています。
3. ノートブックインスタンスのストレージとして、5 GB * 5 インスタンス = 25 GB で計算しています。
4. Processing インスタンスタイプとして ml.m5.xlarge、ジョブ実行時間として 1 日平均 1 時間(1 ヶ月あたり合計 30 時間)で計算しています。
5. Processing インスタンスのストレージとして、 60 GB * 30 時間 / 730 時間 ≒ 2.5 GB を月の利用量として計算しています。
6. トレーニングの実行時間は、1 日平均 1 時間(1 ヶ月あたり合計 30 時間)で計算しています。
7. トレーニングの割合は、ML ワークロード(Scikit-Learn,XGBoostなど)が 60%、ディープラーニングワークロード (PyTorch,Tensorflowなど) が 40%と想定しています。トレーニングインスタンスタイプは、ML ワークロードでは ml.m5.xlarge(0.298 USD/時間)、ディープラーニングワークロードでは ml.p3.2xlarge(5.872 USD/時間)と想定しており、時間単価は 0.298 USD * 0.6 + 5.242 USD * 0.4 = 2.275 USD として計算しています。
8. トレーニングインスタンスのストレージとして、 60 GB * 30時間 / 730 時間 ≒ 2.5 GB を月の利用量として計算しています。
9. ホスティングインスタンスとして、ML ワークロードとして 1 つ、ディープラーニングワークロードとして 1 つ、合計 2 つのモデルをデプロイし、稼働時間として 730 時間 * 2 インスタンス = 1,460 時間で計算しています。
10. ML ワークロード用ホスティングインスタンスとして ml.m5.xlarge(0.298 USD/時間)、ディープラーニングワークロード用ホスティングインスタンスとして ml.p3.2xlarge(5.872 USD/時間)をそれぞれ 730 時間利用します。
11. ホスティングインスタンス用ストレージとして、ml.m5.xlarge 8 GB と ml.p3.2xlarge 30 GB の合計 38 GB で計算しています。
12. データ処理量として、入力 50 GB、出力 50 GB の合計 100 GB で計算しています。
※ 2024 年 3 月 6 日時点での試算です