投稿日: Jul 8, 2022
高いモデルパフォーマンスを発揮する機械学習モデルを生成するための Amazon SageMaker Autopilot の実験が、最大 2 倍の速度で実行されるようになりました。Amazon SageMaker Autopilot は、完全な制御と可視性を維持しながら、データに基づいて最適な機械学習モデルを自動的に構築、トレーニング、調整できるローコードの機械学習製品です。しかし、データセットのサイズが大きくなるにつれて、モデルのトレーニングと調整に必要なコンピューティングコストが増大する可能性があります。
SageMaker Autopilot では、本日よりゼロショットハイパーパラメータ初期化方法と ml.m5.12xlarge インスタンス (48 vCPU、192 GiB メモリ) が使用されるようになり、デフォルトで必要な試行回数が 250 回から 100 回にまで減少します。その結果、SageMaker Autopilot の実験は最短で従来の半分の時間で完了し、非常に高いパフォーマンスを発揮する機械学習モデルが得られます。AWS では、パフォーマンスの向上を評価するため、サイズが 0.5 MB~1 GB の範囲で異なる複数の OpenML ベンチマークデータセットを使用しました。その結果、Autopilot ジョブの全体的な実行時間は、小規模なデータセット (100 MB 未満) で最大 45% の改善が見られ (平均 230 分から 120 分に)、中規模なデータセット (100 MB 超、1 GB 未満) と大規模なデータセット (1 GB 超) で 40% の改善が見られました (平均 540 分から 430 分に)。今回の機能強化により、既存のジョブ設定に変更を加えることなく、SageMaker Autopilot の実験をより高速で実行できるようになりました。
SageMaker Autopilot の詳細については、SageMaker Autopilot の製品ページとドキュメントを参照してください。