Amazon SageMaker 是一項全受管服務,能讓所有開發人員和資料科學家快速輕鬆地建置、訓練及部署機器學習 (ML) 模型。SageMaker 可消除機器學習過程中每個步驟的繁重工作,讓開發高品質模型變得輕而易舉。
傳統的 ML 開發是一個複雜、昂貴、反覆的過程,因為沒有用於整個機器學習工作流程的整合工具,讓這一切變得更加困難。您需要將工具和工作流程拼接在一起,這既耗時又容易出錯。SageMaker 透過在單一工具集中,提供機器學習所用的全部元件來解決這一難題,因此,模型能以更少的工作和更低的成本更快地投入生產。
建置機器學習模型
使用 Amazon SageMaker Ground Truth 將資料標籤成本降低多達 70%
Amazon SageMaker Ground Truth 可協助您快速建置及管理高精準的訓練資料集。Ground Truth 透過 Amazon Mechanical Turk 提供容易存取的標記器,並針對常見的標記任務提供預先建置的工作流程和界面。您還可以使用自己的標籤,或使用 Amazon 透過 AWS Marketplace 推薦的供應商。此外,Ground Truth 會從人類所做的標記不斷學習,以進行高品質的自動註釋,進而大幅降低標記成本。
使用單一 Web 界面建置模型
Amazon SageMaker 可輕鬆建置大規模的機器學習模型 (ML),並提供您一切所需,以存取和分析筆記,並使用內建演算法和架構,讓它們隨時可供訓練。Amazon SageMaker Studio 是首個適用於機器學習的全整合式開發環境 (IDE)。您可以快速上傳資料,創建新的筆記本,訓練和調整模型,在步驟之間來回移動以調整實驗,比較結果,以及將模型部署至一處。您可以將 Amazon SageMaker Autopilot 與 SageMaker Studio 搭配使用以自動產生模型。SageMaker Autopilot 是業界第一個自動機器學習功能,可讓您完全控制和深入了解 ML 模型。SageMaker Autopilot 會自動檢查原始資料、套用功能處理器、選擇最佳演算法集、訓練和調校多個模型、追蹤其效能,然後對模型進行排名,所有動作都只需按幾下滑鼠即可完成。
Amazon SageMaker 筆記本是一鍵式、可共用的 Jupyter 筆記本,能迅速啟動。您還可以從 AWS Marketplace 中提供的數十個預先建置的 SageMaker 筆記本或數百種演算法和預先訓練的模型中選擇。
Amazon SageMaker 支援領先的深度學習框架
入門部落格 使用自有模型標記工作流程 | Amazon SageMaker Studio︰首個完全整合的機器學習開發環境 | 自有授權 MXNet 或 TensorFlow 模型 | 使用 Amazon SageMaker Autopilot 自動建立高品質的機器學習模型 | 快速選擇 ML 執行個體
試用 GitHub 練習 範例筆記本 | SageMaker 演算法 | SageMaker 處理 | 用 Ground Truth 進行標記
訓練機器學習模型
Amazon SageMaker 提供您調校和偵錯模型,以及執行訓練實驗的一切所需,讓您輕鬆訓練機器學習 (ML)。
Amazon SageMaker Experiments 透過自動擷取輸入參數、組態和結果,並將其儲存為「實驗」來協助您管理反覆。您可以在 SageMaker Studio 的視覺化界面中操作,在其中瀏覽作用中的實驗、按其特徵搜尋先前的實驗、檢閱之前的實驗及其結果,以及以視覺化方式比較實驗結果。
Amazon SageMaker Debugger 透過在訓練過程中自動擷取即時指標,例如訓練和驗證、混淆矩陣和學習梯度,來協助提高模型準確性,從而讓訓練過程更加透明。在 SageMaker Studio 中,可將 SageMaker Debugger 中的指標視覺化呈現以方便理解。當偵測到常見訓練問題時,SageMaker Debugger 也可以產生警告和補救建議。
使用受管 Spot 訓練,您可以減少訓練機器學習模型的費用高達 90%。受管 Spot 訓練使用 Amazon EC2 Spot 執行個體,因此相較於 Amazon EC2 隨需執行個體,執行訓練任務的成本低很多。
入門部落格 Amazon SageMaker Debugger – 對您的機器學習模型偵錯 | Amazon SageMaker Experiments – 整理、追蹤和比較 ML 實驗 | Amazon SageMaker Debugger 的 ML 可解釋性 | 執行分散式 TensorFlow 訓練
試用 GitHub 練習 超參數模型調整 | SageMaker Debugger
部署機器學習模型
Amazon SageMaker 為您提供在生產內部署機器學習模型的一切所需,讓您輕鬆產生預測,並監控模型品質。
Amazon SageMaker Model Monitor 可讓您偵測並補救概念偏離。如今,可影響部署模型準確性的一大因素是,用於產生預測的資料是否與用於訓練模型的資料不同。例如,不斷變化的經濟狀況,可能會促使新的利率影響購房預測。這稱為概念漂移,因此模型做出預測所用的模式不再適用。SageMaker Model Monitor 可自動偵測部署模型中的概念漂移,並提供詳細的提醒,以協助確定問題的根源。在 SageMaker 中訓練的所有模型都會自動發出關鍵指標,可在 SageMaker Studio 中收集和檢視這些指標。您可以從 SageMaker Studio 內部設定要收集的資料、檢視資料的方式,以及接收提醒的時間。
許多機器學習應用程式要求人工審查低信賴度預測,以確保結果正確無誤。Amazon Augmented AI 是一項服務,可輕鬆建置 ML 預測人工審查所需的工作流程。此外,您可以使用 Amazon Augmented AI,針對在 Amazon SageMaker 上建置的模型,來建立自己的工作流程。
部署模型後,即可使用 Amazon Elastic Inference 最佳化基礎架構用量。Elastic Inference 可讓您將適當數量且使用 GPU 支援的推論加速連接到任何 Amazon SageMaker 執行個體類型。
入門部落格減少 PyTorch 模型的 ML 推論成本 | 模型再訓練與部署自動化 | Amazon SageMaker Model Monitor – 為您的機器學習模型提供全受管自動監控功能 | 簡化 Kubernetes 上的 ML 推論
試用 GitHub 練習 自動執行自訂模型部署 | SageMaker Model Monitor