Amazon SageMaker

大規模建立、訓練和部署機器學習模型

Amazon SageMaker 是全受管服務,可讓開發人員和資料科學家輕鬆快速地建立、訓練及部署任何規模的機器學習模型。Amazon SageMaker 掃除一切可能會阻礙開發人員使用機器學習的障礙。

大多數開發人員常覺得機器學習出乎意料的困難,因為建立和訓練模型以及將其部署到生產環境的程序都太過複雜和緩慢。首先,您需要收集和準備訓練資料,才能找出資料集中最重要的元素。接著,您需要選擇要使用的演算法和架構。決定方法之後,您需要透過訓練來教導模型如何進行預測,這需要大量的運算。然後,您需要調校模型,讓該模型提供最準確的預測,但這通常很乏味而且需要大量的人力。開發完全訓練的模型之後,您需要整合模型和應用程式,並將此應用程式部署到可擴展的基礎設施上。所有這一切都需要大量的專業知識、存取大量的運算和儲存,以及花費大量時間試驗及優化程序的每個部分。最後,大多數開發人員都覺得這是一項遙不可及的任務。

Amazon SageMaker 透過以下每個步驟免除阻礙開發人員成功的複雜工作。Amazon SageMaker 內含的模組可整合運作,也可獨立用於建立、訓練及部署機器學習模型。

Amazon SageMaker 簡介

運作方式

建立

Amazon SageMaker 可用來輕鬆建立 ML 模型,並提供快速連接至訓練資料所需的一切元件,隨時可供訓練,還能針對您的應用程式選擇及最佳化最適合的演算法與架構。Amazon SageMaker 包含託管型 Jupyter 筆記本,方便您探索及視覺化存放在 Amazon S3 的訓練資料。您可直接連接至 S3 上的資料,或使用 AWS Glue 將資料從 Amazon RDS、Amazon DynamoDB 和 Amazon Redshift 轉移到 S3,以在您的筆記本內進行分析。

為幫助您選出演算法,Amazon SageMaker 內含 12 種最常見的機器學習演算法,這些演算法已預先安裝並經過最佳化,演算法的效能比起在其他地方執行最高可達 10 倍。Amazon SageMaker 也經過預先設定,可執行 TensorFlow 和 Apache MXNet 這兩種最常見的開放原始碼架構。您也可選擇使用自己的架構。

訓練

輕鬆在 Amazon SageMaker 主控台內按一下滑鼠,便能開始訓練模型。Amazon SageMaker 能為您管理所有底層的基礎設施,還能輕鬆為訓練模型執行 PB 級的擴充。為了加快並簡化訓練程序,Amazon SageMaker 可自動調校模型以達到最高的準確度。

部署

模型經過訓練與調校後,Amazon SageMaker 還能讓模型輕鬆進入生產部署,讓您產生新資料的預測 (此程序稱為推論)。Amazon SageMaker 會將模型部署在橫跨多個可用區域的 Amazon EC2 執行個體的自動調整規模叢集上,以提供高效能及高可用性。Amazon SageMaker 也內建 A/B 測試功能,可協助您測試模型,使用不同版本進行實驗,以獲得最好的結果。

Amazon SageMaker 可處理機器學習的繁瑣工作,讓您快速輕鬆建立、訓練及部署機器學習模型。

優點

透過機器學習快速投入生產

Amazon SageMaker 大幅減少了訓練、調校以及部署機器學習模型所需的時間。Amazon SageMaker 可管理和自動化所有複雜的訓練和調校技術,讓您快速將模型投入生產。

選擇任何架構或演算法

Amazon SageMaker 支援所有的機器演算法和架構,所以您可以使用自己熟悉的技術。Amazon SageMaker 已預先安裝 Apache MXNet 和 TensorFlow,並提供一系列內建的高效能機器學習演算法。如果想使用其他架構或演算法進行訓練,可以將自己的架構和演算法放入 Docker 容器中。

一鍵式訓練和部署

使用 Amazon SageMaker 只要在主控台按一下滑鼠或者使用簡單的 API 呼叫就能開始訓練您的模型。訓練完成並準備好部署模型之後,可以在 Amazon SageMaker 主控台按一下滑鼠啟動該模型。

與現有工作流程輕鬆整合

Amazon SageMaker 由三個模組組成,您可以在任何已使用的現有 ML 工作流程中一起使用或獨立使用這些模組。

輕鬆存取經過訓練的模型

Amazon SageMaker 提供可從任何應用程式呼叫的 HTTPS 端點,讓您輕鬆將機器學習模型整合至您的應用程式。

SageMaker 客戶

透過任何深度學習架構進行訓練

透過 Amazon SageMaker,您可以使用自己選擇的深度學習架構來訓練模型。Amazon SageMaker 經過預先設定,可執行 TensorFlow 和 Apache MXNet 這兩種熱門的深度學習架構。您也可以使用自有 Docker 容器搭配任何架構,例如 Caffe2、PyTorch、Microsoft Cognitive Toolkit (CNTK) 或 Torch。

 

TensorFlow
Apache MXNet
Gluon
Caffe2
PyTorch
Keras
Microsoft Cognitive Toolkit
Torch

使用案例

廣告目標

使用 Amazon SageMaker 結合其他 AWS 服務有助於提高廣告投資報酬率。Amazon SageMaker 可以輕鬆訓練和部署機器學習模型,讓您更有效率地運用在線上廣告上,以提高客戶參與和轉換率。推薦系統、點擊預測、客戶細分和終身價值提升模型都可以在 Amazon SageMaker 的無伺服器、分佈式環境中進行訓練。模型建立好之後,可以在低延遲、可擴展的端點上託管,或傳送到其他即時競價系統。

信用違約預測

Amazon SageMaker 可以更輕鬆地預測信用違約可能性,這是一個常見的機器學習問題。Amazon SageMaker 與 Amazon Redshift、Amazon EMR 和 AWS Glue 等現有分析架構密切整合,讓您將大型、多樣化的資料集發布到 Amazon S3 資料湖,然後快速轉換這些資料集、建立機器學習模型,接著立即託管它們以進行線上預測。

工業 IoT 和機器學習

工業 IoT 和機器學習可即時預測預期的機械故障或維修時間表以提高效率。實體資產、程序或系統的雙生數位化或複本都可產生做為模型,以預測預防性維護或優化複雜機器或產業程序的輸出。此模型可針對任何可能發生的變更持續更新,以近乎即時的速度「學習」。

供應鏈和需求預測

Amazon SageMaker 提供的基礎設施和演算法,可針對最大型電子商務環境中的每項產品產生個別銷售預測。Amazon SageMaker 透過時間序列和產品型錄資料找出季節性、趨勢和產品相似度以交付準確的預測,新產品也不例外。

點擊率預測

Amazon SageMaker 提供 XGboost 演算法的單一機器和分散式 CPU 實作,這在多重分類、迴歸和分級等使用案例非常實用,例如廣告點擊率預測。點擊預測系統是大部分線上廣告系統的中心,因為它對盡可能預測最準確的點擊率 (CTR) 以確保客戶獲得最佳體驗而言至關重要。使用 XGBoost 演算法,您可以執行即時預測程式並傳回評分的預測結果。然後就可以判斷是否要從特定的廣告商供應廣告,並改善展示型廣告的 CTR 預測。

預測內容品質

Amazon SageMaker 有多項工具可預先處理和尋找文字中的結構,使用該資訊作出關於內容品質的預測。您可以產生詞向量,在大量文字中尋找類似的語意和句法字詞,並將類似的字詞分組以避免字詞貧乏。然後,以 Amazon SageMaker 的進階主題模型將類似的文件單獨叢集在一起。最後,使用縮減維度的群組字詞資料依叢集建立獨立的分類模型,以判斷文件是否需要仲裁。

進一步了解 Amazon SageMaker

瀏覽功能頁面
準備好開始建立?
開始使用 Amazon SageMaker