投稿日: Sep 1, 2022
SageMaker Autopilot は、完全な制御と可視性を維持しながら、データに基づいて最適な機械学習モデルを自動的にトレーニングおよび調整します。本日より、Autopilot 実験を作成して機械学習モデルをトレーニングする際には、機械学習モデルのトレーニングおよび検証に使用されるデータの分割をカスタマイズできるようになります。デフォルトでは、Autopilot は特定のデータセットを 80% と 20% に分割し、それぞれトレーニング用と検証用に確保します。今回のリリースでは、トレーニングデータおよび検証データの分割割合をカスタマイズしたり、あるいはトレーニング用と検証用として 2 つのデータセットを用意したりすることができます。この機能は、 Amazon SageMaker Studio と SageMaker Autopilot API の両方で使用できます。
トレーニング用データセットと検証用データセットの選択をより効率化するために、今回のリリースではユーザーインターフェイスも改善されています。使いやすくなった S3 ブラウジングエクスペリエンスとガイド付きの段階的なワークフローがユーザーインターフェイスに加わり、詳細設定を完全に制御して可視化できるようになります。
使用を開始するには、Amazon SageMaker Studio を最新リリースに更新して、SageMaker Studio Launcher または Amazon SageMaker Data Wrangler でモデルをトレーニングするワークフローから SageMaker Autopilot を起動します。 Studio を更新する方法の詳細については、ドキュメントを参照してください。
新しい機能とエクスペリエンスは、SageMaker Autopilot が利用可能なすべてのリージョンで利用できます。使用を開始するには、Creating an Experiment with Autopilot (Autopilot で実験を作成する) および SageMaker Autopilot API リファレンスを参照してください。 詳細については、SageMaker Autopilot の製品ページをご覧ください。