一般

問:什麼是 Amazon SageMaker?

Amazon SageMaker 是一項全受管服務,能讓所有開發人員和資料科學家快速輕鬆地建立、訓練及部署機器學習 (ML) 模型。SageMaker 可消除機器學習過程中每個步驟的繁重工作,讓開發高品質模型變得輕而易舉。

問:哪些區域可以使用 Amazon SageMaker?

如需支援的 Amazon SageMaker AWS 區域清單,請參閱所有 AWS 全球基礎架構的 AWS 區域表。如另需詳細資訊,請參閱 AWS 一般參考中的區域和端點

問:什麼是 Amazon SageMaker 的服務可用性?

Amazon SageMaker 的設計可提供高可用性。沒有維護時段或計劃停機時間。SageMaker API 在 Amazon 經過驗證的高可用性資料中心執行,相關的服務堆疊複寫會在每個 AWS 區域的三個設施中進行設定,在伺服器故障或可用區域中斷等狀況提供容錯能力。

問:Amazon SageMaker 有哪些安全措施?

Amazon SageMaker 確保機器學習模型成品和其他系統成品在傳輸和靜止狀態下全部經過加密。對 SageMaker API 和主控台發出的請求,都是透過安全 (SSL) 連線進行。您將 AWS Identity and Access Management 角色交給 SageMaker,提供許可讓它代您存取訓練和部署時所需的資源。您可以將加密的 S3 儲存貯體用於模型成品和資料,還可以將 KMS 金鑰交給 SageMaker 筆記本、訓練任務和端點,以加密連接的 ML 儲存磁碟區。

問:Amazon SageMaker 如何保護我的程式碼安全?

Amazon SageMaker 會將程式碼存放至 ML 儲存磁碟區並由安全群組進行保護,並可選擇在靜態時進行加密。

問:使用 Amazon SageMaker 的費用為何?

您需支付用於託管筆記本、訓練模型、執行預測以及記錄輸出的 ML 運算、儲存和資料處理資源相關費用。您可以利用 Amazon SageMaker 為託管的筆記本、訓練和模型主機選擇要使用的執行個體數量和類型。您只需在使用時按實際用量付費;既沒有最低費用,也無須預付款項。請參閱 Amazon SageMaker 定價頁面了解詳細資訊。

問:如果我有自己的筆記本、訓練或託管環境時該怎麼辦?

Amazon SageMaker 提供一套完整的端對端工作流程,不過現有的工具可以在 SageMaker 中繼續使用。您可以根據業務需求,輕鬆將每個階段的結果傳送至 SageMaker 或者從 SageMaker 傳送至其他地方。

問:Amazon SageMaker 是否支援 R?

是的,Amazon SageMaker 支援 R。您可以在 SageMaker Notebook 執行個體中使用 R,其中包括預先安裝的 R 核心和 reticulate 程式庫。Reticulate 提供 Amazon SageMaker Python SDK 的 R 介面,可讓機器學習從業人員建置、訓練、調整及部署 R 模型。 

問:什麼是 Amazon SageMaker Studio?

Amazon SageMaker Studio 提供單一的 Web 視覺化界面,您可以在其中執行所有 ML 開發步驟。SageMaker Studio 讓您可以完全存取、控制和洞察在建立、訓練和部署模型時需要執行的每個步驟。您可以快速上傳資料,創建新的筆記本,訓練和調整模型,在步驟之間來回移動以調整實驗,比較結果,以及將模型部署至一處,讓您的工作更有效率。在統一的 SageMaker Studio 視覺化界面中可以執行所有 ML 開發活動,包括筆記本、實驗管理、自動建立模型、偵錯和分析,以及模型偏離偵測。

問:什麼是 Amazon SageMaker Autopilot?

Amazon SageMaker Autopilot 是業界第一個自動機器學習功能,可讓您完全控制和深入了解 ML 模型。SageMaker Autopilot 會自動檢查原始資料、套用功能處理器、選擇最佳演算法集、訓練和調整多個模型、追蹤其效能,然後根據效能對模型進行排名,所有動作都只需按幾下滑鼠即可完成。因此,通常只需訓練模型所花時間的一小部分,即可部署效能最佳的模型。您可以全面了解模型的建立方式,以及模型的內容,且 SageMaker Autopilot 與 Amazon SageMaker Studio 整合。您可以在 SageMaker Studio 中探索多達 50 種由 SageMaker Autopilot 產生的不同模型,從而輕鬆地為您的使用案例選擇最佳模型。沒有機器學習經驗的使用者可以使用 SageMaker Autopilot 輕鬆製作模型,經驗豐富的開發人員則可使用 SageMaker Autopilot 快速開發團隊可進一步反覆使用的基線模型。

問:Amazon SageMaker Autopilot 與垂直的 AI 服務 (例如 Amazon Personalize 和 Amazon Forecast) 有何不同?

Amazon Personalize 和 Amazon Forecast 專門針對個人化推薦和預測等使用案例,而 Amazon SageMaker Autopilot 則是一種泛用的自動機器學習解決方案,用於分類和回歸問題,例如偵測詐騙、流失分析以及鎖定目標的行銷。個人化和預測透過服務包提供訓練和模型託管,專注於簡化端對端體驗。您可以使用 Amazon SageMaker Autopilot 訓練模型,並完全掌控模型以及產生模型的管道。然後,他們可以將模型部署到所選擇的託管環境,或進一步進行迭代以提高模型品質。

問:Amazon SageMaker Autopilot 支援哪些內建的演算法?

Amazon SageMaker Autopilot 啟動時支援 2 種內建演算法:XGBoost 和 Linear Learner。

問:Amazon SageMaker Autopilot 是否支援分散式培訓?

是。所有 Amazon SageMaker Autopilot 內建演算法都支援立即可用的分散式訓練。

問:是否可以手動停止 Amazon SageMaker Autopilot 任務?

是。您可以隨時停止任務。停止 Amazon SageMaker Autopilot 任務後,所有進行中的試驗都將停止,並且不會啟動新的試驗。

建立模型

問:什麼是 Amazon SageMaker Studio 筆記本?

Amazon SageMaker Studio 筆記本是新的協作、彈性、受管的 Jupyter 筆記本體驗,屬於適用於機器學習的完全整合式開發環境 Amazon SageMaker Studio 中的部分。

問:SageMaker Studio 筆記本與執行個體型筆記本產品有何不同?

SageMaker Studio 筆記本有幾項重要特色,與執行個體型筆記本形成區隔。憑藉全新的筆記本體驗,您現在可以快速啟動筆記本,而無須手動佈建執行個體並等待其運作。為了閱讀和執行筆記本而開啟 UI 時,啟動時間比執行個體型筆記本快速。

您還能隨時從 UI 內的執行個體類型大型集合之中富有彈性地作出選擇。不再需要移至 AWS 主控台,以啟動新執行個體並移植筆記本。

每位使用者都有與特定執行個體分開獨立的隔離主目錄。此目錄啟動時會自動掛載至所有筆記本伺服器和 Kernel,因此在您切換執行個體以檢視和執行筆記本時,仍然能夠存取筆記本和其他檔案。

SageMaker Studio 筆記本與 AWS SSO 整合,能讓您輕鬆使用組織登入資料存取筆記本。筆記本共用是 SageMaker Studio 筆記本中的整合功能。此外,您點按一下,即可與夥伴共用筆記本。

問:支援哪些類型的筆記本?

目前支援 Jupyter 筆記本。

問:Amazon SageMaker Studio 筆記本的運作方式為何?

Amazon SageMaker Studio 筆記本是一鍵式的 Jupyter 筆記本,能迅速啟動。基礎運算資源極具彈性,因此您可以輕鬆地調高或調低可用資源,而變更會在背景自動進行,不會中斷您的工作。SageMaker 還支援一鍵式共用筆記本。您可輕鬆地與他人共享筆記本,對方將獲得完全相同的筆記本,且儲存在同一位置。

使用 SageMaker Studio 筆記本時,您可以利用 AWS SSO 以公司登入資料進行登入。在團隊內部和團隊之間共用筆記本很容易,因為共用時,會在與筆記本封裝的工作映像中自動追蹤執行筆記本所需的相依性。

問:Amazon SageMaker Studio 筆記本如何與其他 AWS 服務搭配使用?

Amazon SageMaker Studio 筆記本讓您可以使用所有 SageMaker 功能,例如分散式訓練、批次轉換、託管和實驗管理。您可以從 SageMaker 筆記本存取其他服務,例如 Amazon S3、Amazon Redshift、AWS Glue、Amazon EMR 或 AWS Lake Formation 中的資料集。

問:什麼是 Amazon SageMaker Ground Truth?

Amazon SageMaker Ground Truth 使用機器學習技術提供自動資料標記。SageMaker Ground Truth 將先選取一個隨機資料樣本,並將它送給 Amazon Mechanical Turk 進行標記。然後,這些結果將用來訓練標記模型,以嘗試自動標記原始資料的新樣本。當這個模型可以用符合或超過您所設閥值的可信度分數來標記資料時,就會提交這些標籤。當可信度分數低於您的閥值,則會將資料送給人工標籤人員。有些由人工標記的資料會用來產生標記模型的新訓練資料集,而該模型會自動重新訓練以改善準確性。每個需要標記的原始資料樣本會不斷重複進行這個過程。經過重複訓練之後,這個標記模型越來越能自動標記原始資料,而送給人類的資料就越來越少。

訓練模型

問:什麼是 Amazon SageMaker Experiments?

Amazon SageMaker Experiments 可協助您組織和追蹤機器學習模型的反覆執行。SageMaker Experiments 透過自動擷取輸入參數、組態和結果,並將其儲存為「實驗」來協助您管理反覆。您可以在 SageMaker Studio 的視覺化界面中操作,在其中瀏覽作用中的實驗、按其特徵搜尋先前的實驗、檢閱之前的實驗及其結果,以及以視覺化方式比較實驗結果。

問:什麼是 Amazon SageMaker Debugger?

Amazon SageMaker Debugger 透過在訓練過程中自動擷取即時指標,例如訓練和驗證、混淆矩陣和學習梯度,來協助提高模型準確性,從而讓訓練過程更加透明。

在 Amazon SageMaker Studio 中,可將 SageMaker Debugger 的指標視覺化呈現以方便理解。當偵測到常見訓練問題時,SageMaker Debugger 也可以產生警告和補救建議。憑藉 SageMaker Debugger,您可以解釋模型的工作方式,這是邁向模型可解釋性的第一步。

問:什麼是受管 Spot 訓練?

受管 Spot 訓練與 Amazon SageMaker 搭配使用,可讓您透過 Amazon EC2 Spot 執行個體訓練機器學習模型,同時減少訓練模型的費用高達 90%。

問:如何使用受管 Spot 訓練?

您可以在提交訓練任務時啟用「受管 Spot 訓練」選項,也可以指定要等待 Spot 容量的時間。然後,Amazon SageMaker 將使用 Amazon EC2 Spot 執行個體來執行任務並管理 Spot 容量。不管訓練任務正在執行還是正在等待容量,您都可以完全看到訓練任務的狀態。

問:何時應該使用受管 Spot 訓練?

當您可以彈性執行訓練以及想要儘量降低訓練任務的費用時,受管 Spot 訓練是理想選擇。使用受管 Spot 訓練,您可以減少訓練機器學習模型的費用高達 90%。

問:受管 Spot 訓練如何運作?

受管 Spot 訓練將 Amazon EC2 Spot 執行個體用於訓練,且在 AWS 需要容量時可以優先佔用這些執行個體。因此,在容量可用時,受管 Spot 訓練任務能以較小的增量執行。發生中斷時,不需要從頭重新啟動訓練任務,因為 Amazon SageMaker 可以使用最新模型檢查點恢復訓練任務。內建框架和內建電腦視覺演算法與 SageMaker 搭配使用可啟用定期檢查點,您還可以使用自訂模型啟用檢查點。

問:使用受管 Spot 訓練是否需要定期檢查點?

我們建議使用定期檢查點作為長期執行訓練任務的一般最佳實務。如果優先佔用容量,這可阻止受管 Spot 訓練任務重新啟動。啟用檢查點時,Amazon SageMaker 會從上一個檢查點繼續受管 Spot 訓練任務。

問:如何使用受管 Spot 訓練任務計算節省的費用?

完成受管 Spot 訓練任務後,您可以在 AWS 管理主控台中查看節省的費用,也可以用訓練任務執行的持續時間與計費的持續時間之間的百分比差異來計算節省的費用。

無論受管 Spot 訓練任務中斷多少次,都只需按下載資料的持續時間支付費用。

問:哪些執行個體可以與受管 Spot 訓練搭配使用?

受管 Spot 訓練可以與 Amazon SageMaker 中支援的所有執行個體搭配使用。

問:受管 Spot 訓練支援哪些 AWS 區域?

目前提供 Amazon SageMaker 的所有 AWS 區域都支援受管 Spot 訓練。

問:對於可用於訓練的資料集是否有大小限制?

利用 Amazon SageMaker 訓練模型時,資料集的大小沒有一定的限制。

問:我可以輕鬆將哪些資料來源引入Amazon SageMaker?

您可以在建立訓練任務時,指定訓練資料的 Amazon S3 位置。

問:Amazon SageMaker 使用什麼演算法來產生模型?

Amazon SageMaker 包括線性回歸、邏輯回歸、K 均值叢集、主成份分析、因式分解機器、神經主題建模、隱含狄利克雷分布、梯度提升樹、sequence2sequence、時間序列預測、word2vec 和影像分類等內建演算法。SageMaker 還提供優化的 Apache MXNet、Tensorflow、Chainer、PyTorch、Gluon、Keras、Horovod、Scikit-learn 和 Deep Graph Library 容器。此外,如果 Docker 影像符合記載的規格,Amazon SageMaker 也可以支援透過它提供的自訂訓練演算法。

問:什麼是自動模型調校?

大多數機器學習演算法都會公開用來控制基礎演算法運作方式的各種參數。這些參數一般稱為超參數,它們的值會影響訓練模型的品質。自動模型調校是為演算法找出一組超參數的程序,以產出優化的模型。

問:透過自動模型調校可調整哪些模型?

只要符合科學,您就可以在 Amazon SageMaker 的任何演算法上執行自動模型調校,包括內建 SageMaker 演算法、深度神經網路,或您以 Docker 影像格式帶入 SageMaker 的任意演算法。

問:是否可在 Amazon SageMaker 以外使用自動模型調校?

目前不可以。在 Amazon SageMaker 內才能獲得最佳的模型調校效能和體驗。

問:什麼是基礎調校演算法?

目前,我們的調校超參數演算法是貝葉斯優化的自訂實作。主要目標是在調校過程中,優化客戶指定的目標指標。具體來說,它會檢查已完成訓練任務的物件指標,然後利用知識來推論超參數組合,以應用在下一個訓練任務。

問:是否可建議調校專用的特定超參數?

否。特定超參數對模型效能的影響程度取決於多個因素,很難肯定的說某個超參數比其他更為重要,所以需要調校。對於 Amazon SageMaker 中的內建演算法,我們會確定某個超參數是否可進行調校。

問:執行超參數調校任務需要多長的時間?

超參數調校任務所需的時間取決於多個因素,包括資料大小、基礎演算法,還有超參數的值。此外,客戶可以選擇同時訓練任務的數量和訓練任務的總數。這些選擇都會影響超參數調校任務持續的時間長度。

問:是否可像模型一樣同時優化多個目標,使其又快又準確?

目前不可以。目前,您需要指定單一目標指標來優化或變更演算法程式碼以發出新指標,這是兩個或多個實用指標間的加權平均,讓調校程序針對該目標指標進行優化。

問:自動模型調校的費用為何?

超參數調校任務本身不需任何費用。但需根據模型訓練定價,依照超參數調校任務啟動的訓練任務支付費用。

問:我如何決定使用 Amazon SageMaker Autopilot 或自動模型調整?

Amazon SageMaker Autopilot 讓典型的機器學習工作流程完全自動化,包括功能預先處理、演算法選擇和超參數調整,同時特別重視分類和回歸使用案例。另一方面,自動模型調整旨在調整任何模型,無論它是以內建演算法、深度學習框架或者是自訂容器為基礎。為了獲得彈性,您必須手動選擇特定演算法、確定要調整的超參數以及相應的搜尋範圍。

問:什麼是強化學習?

強化學習是一項機器學習技術,可讓代理程式利用來自其動作和體驗的意見反應嘗試錯誤,在互動式環境中學習。

問:我可以在 Amazon SageMaker 中訓練強化學習模型嗎?

是的,除了受監督和未受監督的學習模型外,您還可以在 Amazon SageMaker 中訓練強化學習模型。

問:強化學習與受監督學習有何不同?

雖然受監督和強化學習在輸入和輸出之間都使用映射,不同於受監督學習提供給代理程式的意見反應是用於執行任務的正確動作集,強化學習使用延遲的意見反應,當中的獎勵信號會經過最佳化以透過一序列的動作確保長期目標。

問:何時應該使用強化學習?

受監督學習技術的目標是要根據訓練資料中的模式來找到最好的答案,而未監督學習技術的目標是要找到資料點之間的相似性和差異性。相對來說,強化學習技術的目標是要學習如何達到想要的成果,甚至是在不清楚如何達成該成果時。因此,RL 更適合用來啟用代理程式可以進行自主性決策的智慧型應用程式,例如自動駕駛汽車、HVAC、產業控制等等。

問:我可以對訓練強化學習模型使用什麼類型的環境?

Amazon SageMaker RL 針對訓練強化學習模型支援許多不同的環境。您可以使用 AWS 服務,例如 AWS RoboMaker、開放原始碼環境或使用 Open AI Gym 界面開發的自訂環境,或是商業模擬環境,例如 MATLAB 和 SimuLink。

問:我是否需要編寫我自己的 RL 代理程式演算法以訓練強化學習模型?

不需要,Amazon SageMaker RL 包含的 RL 工具組 (例如 Coach and Ray RLLib) 可提供 RL 代理程式演算法 (例如 DQN、PPO、A3C 等等) 的實作。

問:我可以使用自己的 RL 程式庫和演算法實作,並且在 Amazon SageMaker RL 中執行嗎?

是的,您可以在 Docker 容器中使用自己的 RL 程式庫和演算法實作,並且在 Amazon SageMaker RL 中執行這些項目。

問:是否可以使用 Amazon SageMaker RL 執行分散式推展?

是。您甚至可以選取異質性叢集,其中的訓練可以在單一 GPU 執行個體上執行,而模擬可以在多個 CPU 執行個體上執行。

部署模型

問:什麼是 Amazon SageMaker Model Monitor?

Amazon SageMaker Model Monitor 可讓開發人員偵測並補救概念偏離。SageMaker Model Monitor 可自動偵測部署模型中的概念偏離,並提供詳細的提醒,以協助確定問題的來源。在 SageMaker 中訓練的所有模型都會自動發出關鍵指標,可在 SageMaker Studio 中收集和檢視這些指標。您可以從 SageMaker Studio 內部設定要收集的資料、檢視資料的方式,以及接收提醒的時間。

問:我是否能存取執行 Amazon SageMaker 所在的基礎架構?

不行。Amazon SageMaker 會代您操作該運算基礎設施,允許其執行運作狀態檢查、套用安全性修補程式和執行其他例行維護。您還可以在自己的託管環境中,部署那些利用自訂推論程式碼訓練而成的模型成品。

問:如何在生產環境中擴展 Amazon SageMaker 模型的規模和效能?

Amazon SageMaker 託管功能會利用 Application Auto Scaling 自動為您的應用程式擴展所需的效能。另外,您可以修改端點組態,然後就可以手動變更執行個體數量和類型,不用暫停服務。

問:我如何監控 Amazon SageMaker 的生產環境?

Amazon SageMaker 會將效能指標發送到 Amazon CloudWatch 指標,以便您可以追蹤指標,設定警示並自動對生產流量中的更改作出反應。另外,Amazon SageMaker 會將日誌寫入 Amazon Cloudwatch Logs,以便您監控生產環境並排除異常狀況。

問:Amazon SageMaker 可以託管哪種模型?

Amazon SageMaker 可以託管任何符合 Docker 推論影像記載規格的模型。這包括從 Amazon SageMaker 模型成品和推論程式碼建立的模型。

問:Amazon SageMaker 支援的並行即時 API 請求數量是多少?

Amazon SageMaker 旨在擴展到每秒大量的交易。確切的數字會因部署的模型以及模型部署所在的執行個體數量和類型而異。

問:什麼是批次轉換?

批次轉換可讓您針對大型或小型批次資料進行預測。無須將資料集分解為多個區塊或管理即時端點。使用簡易的 API 時,您可以請求針對大量資料記錄進行預測,並快速、輕鬆地轉換資料。

問:什麼是 Amazon SageMaker Neo?

Amazon SageMaker Neo 能讓機器學習模型訓練一次,並在雲端和邊緣隨處執行。SageMaker Neo 會自動將使用常見深度學習框架建置、可用來在多個硬體平台上部署的模型最佳化。最佳化模型的執行速度最多可提高兩倍,且耗用的資源少於一般機器學習模型的十分之一。

問:如何開始使用 Amazon SageMaker Neo?

若要開始使用 Amazon SageMaker Neo,請登入 Amazon SageMaker 主控台,選擇訓練模型,遵循範例來編譯模型,並將產生的模型部署到您的目標硬體平台。

問:Amazon SageMaker Neo 有哪些主要元件?

Amazon SageMaker Neo 包含兩個主要元件 – 編譯器和執行時間。首先,Neo 編譯器可讀取不同架構匯出的模型。然後將架構特定的函數和操作轉換為跨架構的中繼表示法。下一步是執行一序列的最佳化。然後編譯器會為最佳化操作產生二進位程式碼,並將它們寫入共用的物件程式庫。編譯器也會將模型定義和參數儲存至不同的檔案。在執行期間,Neo 執行時間會載入編譯器產生的成品 -- 模型定義、參數和共用的物件程式庫,以便執行模型。

問:我是否需要使用 Amazon SageMaker 來訓練我的模型以便使用 Amazon SageMaker Neo 來轉換模型?

不需要。您可以在任何位置訓練模型,並使用 Neo 來將它們針對 Amazon SageMaker ML 執行個體或 AWS IoT Greengrass 支援的裝置進行最佳化。

問:Amazon SageMaker Neo 支援哪些模型?

Amazon SageMaker Neo 目前支援為電腦視覺應用程式提供動力的最常見度學習模型,以及 Amazon SageMaker 中現今所使用的最受歡迎決策樹模型。Neo 會將在 MXNet 和 TensorFlow 中訓練的 AlexNet、ResNet、VGG、Inception、MobileNet、SqueezeNet 和 DenseNet 模型,以及在 XGBoost 中訓練的分類和隨機分割森林模型的效能最佳化。

問:Amazon SageMaker Neo 支援哪些平台?

Neo 目前支援 SageMaker ML.C5、ML.C4、ML.M5、ML.M4,、ML.P3 和 ML.P2 執行個體與 AWS DeepLens、Raspberry Pi 和 Jetson TX1 與 TX2 裝置,以及以 Greengrass 裝置為基礎的 Intel® Atom 和 Intel® Xeon CPU、ARM Cortex-A CPU 和 Nvidia Maxwell 與 Pascal GPU。

問:我是否必須使用目標硬體上支援的特定版本框架?

不需要。開發人員可以使用 Amazon SageMaker Neo 容器來執行模型,而不需在框架上安裝相依性。

問:使用 Amazon SageMaker Neo 的費用是多少?

您應針對使用 Amazon SageMaker Neo 執行推論所使用的 Amazon SageMaker ML 執行個體付費。

問:哪些 AWS 區域可以使用 Amazon SageMaker Neo?

要查看支援的區域清單,請參閱 AWS 區域表

進一步了解 Amazon SageMaker 定價

瀏覽定價頁面
準備好開始使用了嗎?
註冊
還有其他問題嗎?
聯絡我們