張貼日期: Dec 3, 2019
現已提供 Amazon SageMaker Autopilot。使用這項功能,Amazon SageMaker 可以使用表格式資料和您指定的目標欄自動訓練和調整模型,同時全盤掌控整個流程。如名稱所示,您可以在 Autopilot 中使用它,以高準確度,透過在 Amazon SageMaker Studio 按一下即部署模型,或將其用作做出決策的指南,可讓您做出取捨,例如準確度、延遲或模型大小。
我們經常難以決定哪個 ML 演算法最適合特定資料集,更不用提難以找出適當的演算法參數。此外,您需要清理資料或預先處理資料,以建置良好的 ML 模型。這相當耗時,且有時需要進階機器學習技能。這些問題導致團隊走捷徑或找解決方法,例如,使用原樣的資料集,而非清理或預先處理資料。團隊最終會使用易於使用的演算法,而非適用於目前問題的演算法。因此,各個公司都在竭力達成所需的模型品質。此外,擁有全面 ML 知識的資料科學家在找到最適合特殊問題的解決方法之前,會花費大量時間試驗不同的 ML 模型,尤其是針對廣告投放或 IoT 的應用程式,其具有模型大小和延遲限制。
Amazon SageMaker Autopilot 可簡化這一完整程序,讓機器學習更輕鬆、更快且更透明。您現在可以不需要深度學習知識即可建置分類和迴歸模型,只需提供標籤式資料集並選取要預測的目標欄,SageMaker Autopilot 會自動使用不同的資料預先處理器、演算法和演算法參數設定組合探索機器學習解決方案,以找到最準確的模型。無需讓您決定使用哪個演算法,SageMaker Autopilot 可自動從高效能演算法中選取其原生支援的適當演算法,並全部進行評估。SageMaker Autopilot 還可自動在這些演算法上試用不同的參數設定,以達成最佳模型品質。現在,您只需按一下,即可直接將最佳模型部署到生產中,或評估多個候選項以在準確度、延遲時間和模型大小之類的指標之間做出取捨。無需擔心資料清理和預先處理,因為 SageMaker Autopilot 會自動對資料套用不同的資料預先處理器類型,然後再透過演算法將其傳遞至訓練模型。