Amazon SageMaker

適用於每個開發人員和資料科學家的機器學習

Amazon SageMaker 是一項全受管服務,能讓所有開發人員和資料科學家快速輕鬆地建立、訓練及部署機器學習 (ML) 模型。SageMaker 可消除機器學習過程中每個步驟的繁重工作,讓開發高品質模型變得輕而易舉。

傳統的 ML 開發是一個複雜、昂貴、反覆的過程,因為沒有用於整個機器學習工作流程的整合工具,讓這一切變得更加困難。您需要將工具和工作流程拼接在一起,這既耗時又容易出錯。SageMaker 透過在單一工具集中,提供機器學習所用的全部元件來解決這一難題,因此,模型能以更少的工作和更低的成本更快地投入生產。

建立機器學習模型

僅限 AMAZON SAGEMAKER

透過使用 Amazon SageMaker Studio 來提高生產效率,這是第一個適用於機器學習的完全整合式開發環境 (IDE)

Amazon SageMaker Studio 提供了一個基於 Web 的單一視覺界面,您可以在其中執行所有 ML 開發步驟。SageMaker Studio 讓您可以完全存取、控制和洞察在建立、訓練和部署模型時需要執行的每個步驟。您可以快速上傳資料,創建新的筆記本,訓練和調整模型,在步驟之間來回移動以調整實驗,比較結果,以及將模型部署至一處,讓您的工作更有效率。在統一的 SageMaker Studio 可視界面中,即可執行所有 ML 開發活動,包括筆記本、實驗管理、自動建立模型、偵錯和效能分析,以及模型漂移偵測。

SageMaker Studio
Sagemaker Studio

使用 IDE 進行 ML 開發。例如,對筆記本內部的模型進行更新,並使用筆記本的並排檢視和訓練實驗,來查看變更如何影響模型品質。

使用 IDE 進行 ML 開發。例如,對筆記本內部的模型進行更新,並使用筆記本的並排檢視和訓練實驗,來查看變更如何影響模型品質。

 按一下以放大

僅限 AMAZON SAGEMAKER

使用 Amazon SageMaker Notebook 更快地建置與協作

管理運算執行個體來檢視、運行或共用筆記本,這是一件繁瑣的工作。Amazon SageMaker Notebooks (目前提供預覽版) 可提供一鍵式 Jupyter 筆記本,讓您在幾秒鐘內即可開始使用。基礎運算資源極具彈性,因此,您可以輕鬆地調高或調低可用資源,並且變更會在後台自動進行,而不會中斷您的工作。SageMaker 還支援一鍵式共用筆記本。自動擷取所有代碼相依項,因此您可以輕鬆地與他人協作。他們將獲得完全相同的筆記本,且儲存在同一位置。

您可以從 SageMaker 中數十種預先建置的筆記本中進行選擇,用於不同的使用案例。此外,您還可以在 AWS Marketplace 中獲得數百種可用的演算法和經過預先訓練的模型,從而輕鬆快速地上手。

Notebooks
Notebooks

產生無需手動追蹤相依項的可共用連結,即可重新產生筆記本代碼。

產生無需手動追蹤相依項的可共用連結,即可重新產生筆記本代碼。

 按一下以放大

僅限 AMAZON SAGEMAKER

藉助 Amazon SageMaker Autopilot 自動建立、訓練和調整具有完全可視性和控制力的模型

Amazon SageMaker Autopilot 是業界首個自動機器學習功能,可讓您完全控制和深入了解 ML 模型。透過自動化機器學習的典型方法,您無法深入了解用於建立模型的資料或用於建立模型的邏輯。結果,即使模型很普通,也無法對其進行改進。此外,由於典型的自動 ML 解決方案僅提供一種模型供您選擇,因此您無法靈活地進行權衡,例如犧牲一些準確性來降低延遲預測。

SageMaker Autopilot 會自動檢查原始資料,套用功能處理器,選擇最佳演算法集,訓練和調整多個模型,追蹤其效能,然後點按幾下,即可根據效能對模型進行排名。因此,通常只需訓練模型所花時間的一小部分,即可部署效能最佳的模型。您可以全面了解模型的建立方式,以及模型的內容,且 SageMaker Autopilot 與 Amazon SageMaker Studio 整合。您可以在 SageMaker Studio 中探索多達 50 種由 SageMaker Autopilot 產生的不同模型,從而輕鬆地為您的使用案例選擇最佳模型。對於沒有機器學習經驗的使用者,可以使用 SageMaker Autopilot 輕鬆產生模型;或者對於經驗豐富的開發人員,則可使用 SageMaker Autopilot 快速開發團隊可進一步反覆使用的基線模型。

進一步了解 »

Autopilot
Autopilot

自動建立機器學習模型,並選擇最適合您使用案例的模型。例如,檢閱排行榜以查看每個選項的執行情況,然後選擇滿足模型準確性和延遲要求的模型。

自動建立機器學習模型,並選擇最適合您使用案例的模型。例如,檢閱排行榜以查看每個選項的執行情況,然後選擇滿足模型準確性和延遲要求的模型。

 按一下以放大

僅限 AMAZON SAGEMAKER

使用 Amazon SageMaker Ground Truth 將資料標籤成本降低多達 70%

成功的機器學習模型仰賴於大量的高品質訓練資料。但是,建立這些模型必要訓練資料的流程通常費用高昂、做法複雜而且耗時。Amazon SageMaker Ground Truth 可協助您快速建立及管理高精準的訓練資料集。Ground Truth 透過 Amazon Mechanical Turk 提供容易存取的標記器,並針對常見的標記任務提供預先建置的工作流程和界面。您還可以使用自己的標籤,或使用 Amazon 透過 AWS Marketplace 推薦的供應商。此外,Ground Truth 會從人類所做的標記不斷學習,以進行高品質的自動註釋,進而大幅降低標記成本。

進一步了解 »

70%

資料標記 成本降低

Amazon SageMaker 支援領先的深度學習框架

支援的框架包括 TensorFlow、PyTorch、Apache MXNet、Chainer、Keras、Gluon、Horovod、Scikit-learn 和 Deep Graph Library。 

Amazon-SageMaker_Framework-Logos_F2f3f3

訓練機器學習模型

僅限 AMAZON SAGEMAKER

使用 Amazon SageMaker Experiments 組織、追蹤和評估訓練執行情況

Amazon SageMaker Experiments 可協助您組織和追蹤機器學習模型的反覆執行。訓練 ML 模型通常需要進行多次反覆,以隔離和量測變更資料集、演算法版本和模型參數的影響。在這些反覆過程中,您會產生數百個成品,例如模型、訓練資料、平台設定、參數設定和訓練指標。通常,使用麻煩的機制 (例如試算表) 來追蹤這些實驗。

SageMaker Experiments 透過自動擷取輸入參數、組態和結果,並將其儲存為「實驗」來協助您管理反覆。您可以在 SageMaker Studio 的可視界面中操作,在其中瀏覽作用中的實驗,按其特徵搜尋先前的實驗,檢閱之前的實驗及其結果,以及以視覺化方式比較實驗結果。

實驗
實驗

追蹤成千上萬個訓練實驗以了解模型的準確性。例如,在圖表中檢視不同時間序列資料集如何影響模型準確性。

追蹤成千上萬個訓練實驗以了解模型的準確性。例如,在圖表中檢視不同時間序列資料集如何影響模型準確性。

 按一下以放大

僅限 AMAZON SAGEMAKER

使用 Amazon SageMaker Debugger 分析、偵錯和修復機器學習問題

機器學習訓練過程在很大程度上是不透明的,訓練模型所需的時間可能很長且難以最佳化。因此,通常很難解釋和說明模型。Amazon SageMaker Debugger 透過在訓練過程中自動擷取即時指標,例如訓練和驗證、混淆矩陣和學習梯度,來協助提高模型準確性,從而讓訓練過程更加透明。

在 SageMaker Studio 中,可將 SageMaker Debugger 中的指標視覺化呈現以方便理解。當偵測到常見訓練問題時,SageMaker Debugger 也可以產生警告和補救建議。憑藉 SageMaker Debugger,您可以解釋模型的工作方式,這是邁向模型可解釋性的第一步。

偵錯工具
偵錯工具

對異常情況進行分析和偵錯。例如,若確定梯度消失,訓練神經網路將會停止。SageMaker Debugger 可識別逐漸消失的梯度,因此您可以在影響培訓之前進行補救。

對異常情況進行分析和偵錯。例如,若確定梯度消失,訓練神經網路將會停止。SageMaker Debugger 可識別逐漸消失的梯度,因此您可以在影響培訓之前進行補救。

 按一下以放大

AWS 是執行 TensorFlow 的最佳場所

AWS 的 TensorFlow 最佳化功能可提供高達數百個 GPU 的近線性擴展效率,這些 CPU 會在雲端規模運作,不會產生大量處理間接成本,進而以更少的時間訓練更準確、更精細的模型。

90%

使用 256 個 GPU 擴展效率

訓練成本降低 90%

Amazon SageMaker 提供 Managed Spot 訓練,可協助您將訓練成本降低多達 90%。此功能使用 Amazon EC2 Spot 執行個體,這是備用的 AWS 運算容量。當運算容量變得可用時,訓練任務會自動執行,並且可以抵抗因容量變化而引起的中斷,從而讓您可以靈活安排訓練任務的時間,從而節省成本。

90%

通過集中管理訓練 降低成本

部署機器學習模型

一鍵式部署

Amazon SageMaker 讓您只要按一下就能在生產環境中輕鬆部署訓練模型,以便您為即時或批次資料產生預測。您可以按一下滑鼠就能將模型部署到多個可用區域上的自動調整規模 Amazon ML 執行個體,以獲得高冗餘。只要指定執行個體的類型,以及需要的最大和最小數量即可,SageMaker 將會完成剩餘的工作。SageMaker 會啟動執行個體、部署您的模型,以及為您的應用程式設定安全的 HTTPS 端點。您的應用程式只須包含這個端點的 API 呼叫,即可達成低延遲、高輸送量推斷。因為變更模型不再需要同時更改應用程式的程式碼,所以這個架構可讓您將新模型整合到應用程式筆記。

僅限 AMAZON SAGEMAKER

使用 Amazon SageMaker Model Monitor 保持模型一段時間的準確性

Amazon SageMaker Model Monitor 可讓開發人員偵測並補救概念漂移。如今,可影響部署模型準確性的一大因素是,用於產生預測的資料是否與用於訓練模型的資料不同。例如,不斷變化的經濟狀況,可能會促使新的利率影響購房預測。這稱為概念漂移,因此模型做出預測所用的模式不再適用。SageMaker Model Monitor 可自動偵測部署模型中的概念漂移,並提供詳細的提醒,以協助確定問題的根源。在 SageMaker 中訓練的所有模型都會自動發出關鍵指標,可在 SageMaker Studio 中收集和檢視這些指標。在 SageMaker Studio 內部,您可以設定要收集的資料、檢視資料的方式,以及接收提醒的時間。

模型監控
模型監控

監控生產中的模型。例如,檢視具有重要模型功能和摘要統計資料的圖表,在一段時間後進行觀察,並與訓練中使用的功能作比較。當模型在生產中執行時,某些功能會漂移,這表明需要重新訓練模型。

監控生產中的模型。例如,檢視具有重要模型功能和摘要統計資料的圖表,在一段時間後進行觀察,並與訓練中使用的功能作比較。當模型在生產中執行時,某些功能會漂移,這表明需要重新訓練模型。

 按一下以放大

僅限 AMAZON SAGEMAKER

通過人工審查驗證預測

許多機器學習應用程式要求人工審查低信賴度預測,以確保結果正確無誤。但將人工審查整合至工作流程可能既耗時又昂貴,且涉及復雜的程序。Amazon Augmented AI 是一項服務,可輕鬆建立機器學習預測人工審查所需的工作流程。Augmented AI 針對常見的機器學習使用案例,提供內建人工審查工作流程。此外,您還可以針對在 Amazon SageMaker 上建置的模型,來建立自己的工作流程。藉助 Augmented AI,您可以在模型無法做出高信賴度預測時,允許人工審查者介入。

進一步了解 »

使用 Amazon Elastic Inference,可將機器學習推斷成本降低多達 75%

在大多數深度學習應用程式中,使用經過訓練的模型作預測的過程稱為推斷,這可能是應用程式運算成本的主要因素。完整的 GPU 執行個體可能過大,無法進行模型推斷。此外,難以將深度學習應用程式的 GPU、CPU 和記憶體需求最佳化。Amazon Elastic Inference 可讓您在任何 Amazon EC2、Amazon SageMaker 執行個體類型或 Amazon ECS 任務上附加適當的 GPU 支援推斷加速數量,不需變更任何程式碼,就能解決上述問題。您可以透過 Elastic Inference 選擇最適合應用程式整體 CPU 和記憶體需求的執行個體類型,然後單獨設定所需的推斷加速數量,以便有效率地運用資源,進而降低執行推斷的成本。

降低

75% 的推斷成本

利用 Kubernetes 整合進行協調和管理

Kubernetes 是一種開放原始碼系統,用於實現容器化應用程式的部署、擴展和管理自動化。許多客戶不僅希望使用 Amazon SageMaker 的全受管功能進行機器學習,還希望平台和基礎架構團隊繼續使用 Kubernetes 來協調和管理管道。SageMaker 讓使用者能夠使用 Kubernetes 運算子和管道,在 SageMaker 中訓練和部署模型。Kubernetes 使用者可透過 Kubeflow,在本機存取 SageMaker 的所有功能。

開始使用 Amazon SageMaker

開始在 AWS 管理主控台使用 Amazon Sagemaker 進行建置。