投稿日: Nov 28, 2018
Amazon SageMaker では、推論パイプラインのデプロイをサポートします。これにより、未加工の入力データを渡したり、リアルタイムまたは一括の推論リクエストで前処理、予測、後処理を実行したりできます。SageMaker では、Scikit-learn および Spark ML の 2 つの新しい機械学習フレームワークもサポートします。これにより、Amazon SageMaker の新しい SparkML と Scikit-learn フレームワークコンテナで利用可能な一連のフィーチャートランスフォーマーを使用して、フィーチャーの前処理パイプラインを簡単に構築してデプロイできます。またこれらの新機能により、一度書いた SparkML や Scikit-learn のコードを、前処理ステップの整合性と機械学習プロセスの管理をより簡単にするトレーニングと推論に再利用することもできます。
一般的に、機械学習モデルのトレーニング前には、データのクリーニングや準備に多くの時間を費します。推論中にも、同じステップを適用する必要があります。以前は、推論リクエストの入力データは、予測のために Amazon SageMaker に送信される前または推論コンテナに組み込まれる前に、クライアントアプリケーションでデータ処理と特徴選択のステップを実行する必要がありました。新しい推論パイプラインを使用すると、トレーニングに使用された前処理および後処理のステップをバンドルしてエクスポートし、推論パイプラインの一部としてデプロイできます。推論パイプラインは、機械学習フレームワーク、組み込みアルゴリズム、または Amazon SageMaker 上で使用できるカスタムコンテナで任意に構成することができます。
これらの強化は、Amazon SageMaker を現在使用できるすべての AWS リージョンで利用できます。詳細については、ドキュメントをご覧ください。