リファレンスデプロイ

AWS での Amazon SageMaker とデータレイクを使用した予測データサイエンス

予測的で規範的なアプリケーションの構築に向けたデータの保存と変換

このクイックスタートでは、Amazon SageMaker を使用し、アマゾンウェブサービス (AWS) クラウドでの Machine Learning (ML) モデルの構築、トレーニング、デプロイをサポートするデータレイク環境を構築します。このデプロイにはおよそ 10~15 分かかります。デプロイには Amazon Simple Storage Service (Amazon S3)、Amazon API Gateway、Amazon Kinesis Data Streams、Amazon Kinesis Data Firehose などの AWS のサービスを使用します。

Amazon SageMaker は、開発者やデータサイエンティストが ML モデルの構築、トレーニング、デプロイを短時間で簡単に実行できるマネージド型プラットフォームです。

このクイックスタートは、複雑な ML ハードウェアクラスターを構成する必要を避け、データを活用して予測的で規範的なモデルを構築する方法で事業価値を生み出そうとするユーザーを対象としています。これで未加工データから本番システムの予測 REST API までに対応するエンドツーエンドのデータサイエンスが実現します。

このクイックスタートには、Pariveda Solutions の開発したデモシナリオも組み込まれています。このデモでは、未加工データを Amazon S3 に保存する方法、そのデータを Amazon SageMaker 用に変換する方法、Amazon SageMaker を使用して ML モデルを構築する方法、そのモデルを Amazon Elastic Compute Cloud (Amazon EC2) スポット料金向けに予測 API でホストする方法がわかります。

pariveda-data-lake-sagemaker-LP-logo

このクイックスタートは、Pariveda Solutions と AWS が共同開発しました。Pariveda は、APN パートナーです。

すべての AWS ソリューションを調べる »
  •  構築するもの
  •  デプロイ方法
  •  コストとライセンス
  •  リソース
  •  構築するもの
  • クイックスタートでは、以下を構築します。

    • Amazon S3 で未加工、モデル化、加工済み、変換済みのデータを保持する構造化データレイク。
    • Amazon SageMaker に取り込む機能加工済み変換データ用のステージングバケット。
    • AWS Lambda でホストされ、消費や ML モデルトレーニングに備えて未加工データを用意し、データの入出力を変換するデータ変換コード。
    • データレイク内のデータ変更というトリガーや所定のスケジュールに沿って、新しいモデルの REST エンドポイントを構築、管理、作成する Lambda 関数ベースの Amazon SageMaker の自動化。
    • 開発者がアプリケーションの履歴データや予測を取得できるようサポートするパブリック API をホストする、Amazon API Gateway のエンドポイント。
    • 取り込み、モデル化、加工、変換という複数のステージに対応し、新規データのリアルタイム処理をサポートする Amazon Kinesis Data Streams。
    • モデル化フェーズと加工フェーズの結果を Amazon S3 に提供し、堅牢なストレージを用意する Amazon Kinesis Data Firehose。
    • データ変換の監視、モデルトレーニング、予測エンドポイントのコンポーネントのホスティングができる Amazon CloudWatch ダッシュボード。
    • Jupyter ノートブックを使用し、データ調査をサポートする AWS SageMaker ノートブックサーバー。
    • 各処理コンポーネントで最小権限の原則を徹底する AWS Identity and Access Management (IAM)。この IAM ロールとポリシーで、必要なリソースのみにアクセスを制限。
    • Amazon Elastic Compute Cloud (Amazon EC2) の日常的なスポット価格の予測モデルを構築し、更新するデモシナリオ。
  •  デプロイ方法
  • 次のとおり少数のシンプルなステップに沿って、10~15分で AWS 上に Amazon SageMaker とデータレイクによる予測データサイエンス環境を構築できます。

    1. AWS アカウントをお持ちでない場合は、https://aws.amazon.com でサインアップしてください。
    2. クイックスタートを起動します
    3. (オプション) 用意されたデモシナリオでデプロイした環境をテストします。
    4. (オプション) 独自に ML モデルのトレーニングを実施します。
  •  コストとライセンス
  • このクイックスタートリファレンスデプロイの実行中に使用した AWS のサービスのコストは、お客様が負担します。クイックスタートを使用しても追加コストは発生しません。

    このクイックスタートの AWS CloudFormation テンプレートには、カスタマイズ可能な設定パラメータが含まれています。インスタンスタイプなどの設定の一部は、デプロイにかかるコストに影響を与えます。費用の見積もりについては、使用する AWS の各サービスの料金ページをご覧ください。料金は変更する場合があります。

    このクイックスタートはネイティブの AWS のサービスを使用しているため、追加のライセンシングは不要です。

  •  リソース
  • このクイックスタートリファレンスデプロイは、ソリューションスペースで紹介されているソリューションと関連しています。これにはソリューション概要、AWS コンピテンシーパートナーが作成したコンサルティングオファーのオプション、概念実証 (PoC) プロジェクトでの AWS の共同投資が含まれます。これらのリソースの詳細については、ソリューションスペースをご覧ください。