投稿日: Jan 28, 2022
Amazon SageMaker Autopilot は、完全な制御と可視性を維持しながら、データに基づいて最適な機械学習モデルを自動的に構築、トレーニング、および調整します。SageMaker Autopilot を使用して、今までのサポートの制限である 10 GB を超えるデータセットで回帰および分類の問題の機械学習モデルを構築できるようになりました。本日より、SageMaker Autopilot は、SageMaker Autopilot が現在サポートされているすべての AWS リージョンでデフォルトで最大 100 GB までのサイズのデータセットをサポートします。SageMaker Autopilot は、クラスの不均衡を考慮し、まれなクラスラベルを保持しながら、データセットを自動的にサブサンプリングします。AWS Support Center コンソールで制限の引き上げをリクエストすることで、デフォルトの 100 GB のサービス制限を引き上げ、100 GB を超えるデータセットをサポートできるようになります。
通常どおり、SageMaker Autopilot が S3 バケット内のデータセットをポイントするようにするだけで、最大 100 GB までのデータセットを使用して機械学習モデルの構築を自動的に開始できます。Autopilot は、このデータを自動的に解析して、クラスの不均衡を検出し、観測値をダウンサンプリングしますが、少数派クラスの観測値はバイナリ分類の問題で保持します。詳細については、Amazon SageMaker Autopilot クォータを参照してください。深く掘り下げるには、この機能のリリースをプレビューするブログ投稿とサンプルノートブックを確認してください。SageMaker Autopilot の使用をスタートするには、製品ページを参照するか、SageMaker Studio 内の SageMaker Autopilot にアクセスしてください。