Amazon SageMaker Pipelines

機械学習向けの初めての専用 CI/CD サービス

膨大なデータ量、何千ものトレーニング実験、何百ものモデルバージョンを含むエンドツーエンドの機械学習ワークフローを大規模に作成、自動化、管理

データロード、データ変換、トレーニングとチューニング、デプロイなど、機械学習ワークフローのさまざまなステップを自動化

ワークフローの共有と再利用により、モデルの再作成や最適化を行い、機械学習のスケールと MLOps プラクティスの構築を支援

主な特徴

ML ワークフローを作成、管理、および再利用する

Amazon SageMaker Pipelines を使用すると、使いやすい Python SDK を使用して ML ワークフローを作成し、Amazon SageMaker Studio を使用してワークフローを可視化および管理できます。SageMaker Pipelines で作成したワークフローステップを保存して再利用することで、より効率的に拡張できます。また、モデルを構築、テスト、登録、およびデプロイするための組み込みテンプレートをすばやく開始できるため、ML 環境で CI/CD をすばやく開始できます。

本番環境にデプロイする際に最適なモデルを選択する

多くの顧客が数多くのワークフローを備えており、それぞれが同じモデルの異なるバージョンを持っています。SageMaker Pipelines モデルレジストリを使用すれば、中央リポジトリでこれらのバージョンを追跡できます。さらに、ビジネス要件に基づいて、デプロイに適したモデルを簡単に選択できます。SageMaker Studio を使用してモデルを参照および検出するか、SageMaker Python SDK を介してモデルにアクセスすることができます。

モデルの自動追跡

Amazon SageMaker Pipelines はワークフローのすべてのステップをログに記録し、トレーニングデータ、プラットフォーム構成、モデルパラメータ、学習勾配などのモデルコンポーネントの監査証跡を作成します。監査証跡を使用して、モデルを再作成し、コンプライアンス要件をサポートできます。

CI/CD を機械学習に導入する

Amazon SageMaker Pipelines は、開発環境と本番環境の間での同等性の維持、バージョン管理、オンデマンドテスト、エンドツーエンドの自動化など、CI/CD プラクティスを機械学習にもたらし、組織全体で ML を拡張できるようにします。

お客様

iFood
「iFood では、機械学習 (ML) などのテクノロジーを使用したサービスを通じて、お客様を喜ばせるよう努めています。...モデルを開発、トレーニング、およびデプロイするための完全でシームレスなワークフローを構築することは、ML をスケーリングする過程において重要な部分です。Amazon SageMaker Pipelines は、複数のスケーラブルな自動 ML ワークフローを迅速に構築する場合に役に立ち、モデルの効果的なデプロイおよび管理を容易にします。SageMaker Pipelines を使用すれば、開発サイクルをより効率的にすることができます。私たちは、AI/ML を使用して、Amazon SageMaker のすべての新機能において優れたカスタマーサービスと効率を提供するというリーダーシップを引き続き強調しています」

Sandor Caetano 氏、チーフデータサイエンティスト、iFood

Invista
「INVISTA では、変革を推進し、世界中のお客様に利益をもたらす製品とテクノロジーの開発を目指しています。機械学習は顧客体験を向上させる方法だと考えていますが、データセットが数億行に及ぶため、データの準備、ML モデルの大規模な開発、デプロイ、管理にとって有用なソリューションが必要でした。Amazon SageMaker Pipelines を使用すれば、ML ワークフローの自動化や管理を大規模かつ簡単に行えるため、ML ワークフローの個々のステップを簡単につなぎ合わせることができます。…Amazon SageMaker Pipelines では、ML ワークフローをより迅速に運用できます」

Caleb Wilkinson 氏、リードデータサイエンティスト - INVISTA

Care.com
「個別家計から国内総生産におよぶまでの経済成長には、供給と需要が一致する強力な医療産業が不可欠です。Amazon SageMaker Pipelines は、一貫したキュレーション済みのデータセットを使用することで、データサイエンスおよび開発チーム全体でより適切に拡張を行えると確信しています。これは、データの準備からデプロイに至るまで、スケーラブルなエンドツーエンドの機械学習 (ML) モデルパイプラインを構築するために使用できます。新たに発表された Amazon SageMaker の機能により、さまざまなアプリケーションに向けた ML モデルの開発とデプロイを加速し、リアルタイムの推奨を迅速に行うことで、お客様が多くの情報に基づいた意思決定を行えるように支援します」

Clemens Tummeltshammer、データサイエンスマネージャー、Care.com

3M
「3M は ML を使用して、サンドペーパーなどの実証済みの製品を改善し、ヘルスケアを含む他のいくつかの分野でイノベーションを推進しています。当社では、3M のより多くの領域に機械学習をスケールすることを計画しているため、データとモデルの量は急速に増加し、毎年 2 倍になっています。SageMaker の新機能はスケールに役立つため、当社にメリットをもたらしてくれるものであると確信しています。Amazon SageMaker Data Wrangler を使用すると、モデルトレーニング用のデータの準備がはるかに簡単になり、Amazon SageMaker Feature Store を使用すると、同じモデル特徴量を何度も作成する必要がなくなります。最後に、Amazon SageMaker Pipelines は、データの準備、モデルの構築、およびモデルのデプロイをエンドツーエンドのワークフローに自動化するのに役立つため、モデルの市場投入までの時間を短縮できます。当社の研究者たちは、3M の科学の新たなスピードを活用することを楽しみにしています」

David Frazee 氏、テクニカルディレクター、3M Corporate Systems Research Lab

リソース

動画

Amazon SageMaker Pipelines を使用して完全に自動化された ML ワークフローを作成する方法 (29:23)