一般

問:什麼是 Amazon SageMaker?

Amazon SageMaker 是一項全受管服務,可讓資料科學家和開發人員快速輕鬆地建立、訓練及部署機器學習模型。

問:Amazon SageMaker 可以用來做什麼?

開發人員和科學家可以利用 Amazon SageMaker 建立機器學習模型,應用於各種智慧預測應用程式。

問:如何開始使用 Amazon SageMaker?

要開始使用 Amazon SageMaker,請登入 Amazon SageMaker 主控台,在範例筆記本啟動筆記本執行個體,然後修改它以連接到您的資料來源,再按照範例建立/訓練/驗證模型,最後輸入幾筆數據,將產生的模型部署到生產用途。

問:哪些區域可以使用 Amazon SageMaker?

如需支援的 Amazon SageMaker AWS 區域清單,請參閱所有 AWS 全球基礎設施的 AWS 區域表。另外如需詳細資訊,請參閱 AWS 一般參考中的區域和端點

問:是否可取得從我的帳戶發出的 Amazon SageMaker API 呼叫歷史記錄,以便用於安全分析和操作故障排除? 

是。要取得從您的帳戶發出的 Amazon SageMaker API 呼叫歷史記錄,您只需在 AWS 管理主控台中開啟 AWS CloudTrail 即可。*不會*記錄和交付 Amazon SageMaker 執行時間的以下 API 呼叫:InvokeEndpoint。

問:Amazon SageMaker 的服務可用性如何?

Amazon SageMaker 的設計可提供高可用性。沒有維護時段或計劃停機時間。Amazon SageMaker API 是在 Amazon 經過驗證的高可用性資料中心執行,相關的服務堆疊會在每個 AWS 區域的三個設施中進行複寫設定,以提供容錯能力,防止伺服器故障或可用區域中斷等狀況導致的損失。

問:Amazon SageMaker 有哪些安全措施?

Amazon SageMaker 確保機器學習模型成品和其他系統成品在傳輸和靜止狀態下全部經過加密。對 Amazon SageMaker API 和主控台發出的請求,都是透過安全 (SSL) 連線進行。當您將 AWS Identity and Access Management 角色交給 Amazon SageMaker 之後,它就有為您準備訓練和部署時所需一切資源的許可。您可以將加密的 S3 儲存貯體用於模型成品和資料,還可以將 KMS 金鑰交給 Amazon SageMaker 筆記本、訓練任務和端點,以加密連接的 ML 儲存磁碟區。

問:Amazon SageMaker 如何保護我的程式碼安全?

Amazon SageMaker 會將程式碼存放至 ML 儲存磁碟區並由安全群組進行保護,並可選擇在靜態時進行加密。

問:使用 Amazon SageMaker 的費用為何?

您需支付用於託管筆記本、訓練模型、執行預測以及記錄輸出的 ML 運算、儲存和資料處理資源相關費用。您可以利用 Amazon SageMaker 為託管的筆記本、訓練和模型主機選擇要使用的執行個體數量和類型。您只需按實際用量付費;既沒有最低費用,也無須預付款項。

問:如果我有自己的筆記本、訓練或託管環境時該怎麼辦?

Amazon SageMaker 提供一套完整的端對端工作流程,不過現有的工具可以在 Amazon SageMaker 中繼續使用。您可以根據業務需求,輕鬆將每個階段的結果傳送至 Amazon SageMaker 或者從 Amazon SageMaker 傳送至其他地方。

託管的 Jupyter 筆記本

問:支援哪些類型的筆記本?

目前支援 Jupyter 筆記本。

問:當我停止工作空間時,您如何保留筆記本檔案?

您可以將筆記本檔案保留在連接的 ML 儲存磁碟區。筆記本執行個體關閉時,ML 儲存磁碟區便會分離,筆記本執行個體重新啟動時,ML 儲存磁碟區就會將重新連接。存放在記憶體中的項目將不會被保留。

問:我如何增加筆記本中的可用資源?

您可以修改筆記本執行個體,並在將檔案和資料儲存到連接的 ML 儲存磁碟區後,從 Amazon SageMaker 主控台選擇更大的設定檔。筆記本執行個體重新啟動會得到更多的可用資源,還會有相同的筆記本檔案和安裝的程式庫。

問:如何從 Amazon SageMaker 筆記本訓練模型?

啟動範例筆記本後,您可以自訂筆記本來配合您的資料來源和結構描述,並執行 AWS API 來建立訓練任務。您可以從 Amazon SageMaker 主控台或 AWS API 了解訓練任務的進度或完成狀態。

模型訓練

問:什麼是受管 Spot 訓練?

受管 Spot 訓練與 Amazon SageMaker 搭配使用,可讓您透過 Amazon EC2 Spot 執行個體訓練機器學習模型,同時減少訓練模型的費用高達 90%。

問:如何使用受管 Spot 訓練?

您可以在提交訓練任務時啟用「受管 Spot 訓練」選項,也可以指定要等待 Spot 容量的時間。然後,Amazon SageMaker 將使用 Amazon EC2 Spot 執行個體來執行任務並管理 Spot 容量。不管訓練任務正在執行還是正在等待容量,您都可以完全看到訓練任務的狀態。

問:何時應該使用受管 Spot 訓練?

當您可以彈性執行訓練以及想要儘量降低訓練任務的費用時,受管 Spot 訓練是理想選擇。使用受管 Spot 訓練,您可以減少訓練機器學習模型的費用高達 90%。

問:受管 Spot 訓練如何運作?

受管 Spot 訓練將 Amazon EC2 Spot 執行個體用於訓練,且在 AWS 需要容量時可以優先佔用這些執行個體。因此,在容量可用時,受管 Spot 訓練任務能以較小的增量執行。發生中斷時,不需要從頭重新啟動訓練任務,因為 Amazon SageMaker 可以使用最新模型檢查點恢復訓練任務。內建框架和內建電腦視覺演算法與 Amazon SageMaker 搭配使用可啟用定期檢查點,您還可以使用自訂模型啟用檢查點。

問:使用受管 Spot 訓練是否需要定期檢查點?

我們建議使用定期檢查點作為長期執行訓練任務的一般最佳實務。如果優先佔用容量,這可阻止受管 Spot 訓練任務重新啟動。啟用檢查點時,Amazon SageMaker 會從上一個檢查點繼續受管 Spot 訓練任務。 

問:如何使用受管 Spot 訓練任務計算節省的費用?

完成受管 Spot 訓練任務後,您可以在 AWS 管理主控台中查看節省的費用,也可以用訓練任務執行的持續時間與計費的持續時間之間的百分比差異來計算節省的費用。

無論受管 Spot 訓練任務中斷多少次,都只需按下載的資料量支付費用。

問:哪些執行個體可以與受管 Spot 訓練搭配使用?

受管 Spot 訓練可以與 Amazon SageMaker 中支援的所有執行個體搭配使用。

問:受管 Spot 訓練支援哪些 AWS 區域?

目前可用 Amazon SageMaker 的所有 AWS 區域都支援受管 Spot 訓練。

問:對於可用於訓練的資料集是否有大小限制?

利用 Amazon SageMaker 訓練模型時,資料集的大小沒有一定的限制。

問:我可以輕鬆將哪些資料來源引入Amazon SageMaker?

您可以在建立訓練任務時,指定訓練資料的 Amazon S3 位置。

問:Amazon SageMaker 使用什麼演算法來產生模型?

Amazon SageMaker 包括線性回歸、邏輯回歸、K 均值叢集、主成份分析、因式分解機器、神經主題建模、隱含狄利克雷分布、梯度提升樹、sequence2sequence、時間序列預測、word2vec 和影像分類等內建演算法。Amazon SageMaker 還提供優化的 Apache MXNet、Tensorflow、Chainer 和 PyTorch 容器。此外,如果 Docker 影像符合記載的規格,Amazon SageMaker 也可以支援透過它提供的自訂訓練演算法。

問:什麼是自動模型調校?

大多數機器學習演算法都會公開用來控制基礎演算法運作方式的各種參數。這些參數一般稱為超參數,它們的值會影響訓練模型的品質。自動模型調校是為演算法找出一組超參數的程序,以產出優化的模型。

問:透過自動模型調校可調整哪些模型?

只要符合科學,您就可以在 Amazon SageMaker 的任何演算法上執行自動模型調校,包括內建 SageMaker 演算法、深度神經網路,或您以 Docker 影像格式帶入 Amazon SageMaker 的任意演算法。

問:是否可在 Amazon SageMaker 以外使用自動模型調校?

目前沒有。在 Amazon SageMaker 內才能獲得最佳的模型調校效能和體驗。

問:什麼是基礎調校演算法?

目前,我們的調校超參數演算法是貝葉斯優化的自訂實作。主要目標是在調校過程中,優化客戶指定的目標指標。具體來說,它會檢查已完成訓練任務的物件指標,然後利用知識來推論超參數組合,以應用在下一個訓練任務。

問:是否可建議調校專用的特定超參數?

不,特定超參數對模型效能的影響程度取決於多個因素,很難肯定的說某個超參數比其他更為重要,所以需要調校。對於 Amazon SageMaker 中的內建演算法,我們會確定某個超參數是否可進行調校。

問:執行超參數調校任務需要多長的時間?

超參數調校任務所需的時間取決於多個因素,包括資料大小、基礎演算法,還有超參數的值。此外,客戶可以選擇同時訓練任務的數量和訓練任務的總數。這些選擇都會影響超參數調校任務持續的時間長度。 

問:是否可像模型一樣同時優化多個目標,使其又快又準確?

目前沒有。目前,您需要指定單一目標指標來優化或變更演算法程式碼以發出新指標,這是兩個或多個實用指標間的加權平均,讓調校程序針對該目標指標進行優化。

問:自動模型調校的費用為何?

超參數調校任務本身不需任何費用。但需根據模型訓練定價,依照超參數調校任務啟動的訓練任務支付費用。

問:什麼是強化學習?

強化學習是一項機器學習技術,可讓代理程式利用來自其動作和體驗的意見反應嘗試錯誤,在互動式環境中學習。

問:我可以在 Amazon SageMaker 中訓練強化學習模型嗎?

是的,除了傳統受監督和未受監督的學習外,您還可以在 Amazon SageMaker 中訓練強化學習模型。

問:強化學習與受監督學習有何不同?

雖然受監督和強化學習在輸入和輸出之間都使用映射,不同於受監督學習提供給代理程式的意見反應是用於執行任務的正確動作集,強化學習使用延遲的意見反應,當中的獎勵信號會經過最佳化以透過一序列的動作確保長期目標。

問:何時應該使用強化學習?

受監督學習技術的目標是要根據訓練資料中的模式來找到最好的答案,而未監督學習技術的目標是要找到資料點之間的相似性和差異性。相對來說,強化學習技術的目標是要學習如何達到想要的成果,甚至是在不清楚如何達成該成果時。因此,RL 更適合用來啟用代理程式可以進行自主性決策的智慧型應用程式,例如自動駕駛汽車、HVAC、產業控制等等。

問:我可以對訓練強化學習模型使用什麼類型的環境?

Amazon SageMaker RL 針對訓練強化學習模型支援許多不同的環境。您可以使用 AWS 服務,例如 AWS RoboMaker、開放原始碼環境或使用 Open AI Gym 界面開發的自訂環境,或是商業模擬環境,例如 MATLAB 和 SimuLink。

問:我是否需要編寫我自己的 RL 代理程式演算法以訓練強化學習模型?

不需要,Amazon SageMaker RL 包含的 RL 工具組 (例如 Coach and Ray RLLib) 可提供 RL 代理程式演算法 (例如 DQN、PPO、A3C 等等) 的實作。

問:我可以使用自己的 RL 程式庫和演算法實作,並且在 Amazon SageMaker RL 中執行嗎?

是的,您可以在 Docker 容器中使用自己的 RL 程式庫和演算法實作,並且在 Amazon SageMaker RL 中執行這些。

問:我可以使用 Amazon SageMaker RL 來執行分散式推展嗎?

是。您甚至可以選取異質性叢集,其中的訓練可以在單一 GPU 執行個體上執行,而模擬可以在多個 CPU 執行個體上執行。

問:什麼是 Amazon SageMaker Neo?

Amazon SageMaker Neo 是一項新功能,允許機器學習模型訓練一次,並在雲端和邊緣隨處執行。SageMaker Neo 會自動將使用常見深度學習架構建置、可用來在多個硬體平台上部署的模型最佳化。最佳化模型的執行速度最多可提高兩倍,且耗用的資源少於一般機器學習模型的十分之一。

問:如何開始使用 Amazon SageMaker Neo?

若要開始使用 Amazon SageMaker Neo,請登入 Amazon SageMaker 主控台,選擇訓練模型,遵循範例來編譯模型,並將產生的模型部署到您的目標硬體平台。

問:Amazon SageMaker Neo 有哪些主要元件?

Amazon SageMaker Neo 包含兩個主要元件 – 編譯器和執行時間。首先,Neo 編譯器可讀取不同架構匯出的模型。然後將架構特定的函數和操作轉換為跨架構的中繼表示法。下一步是執行一序列的最佳化。然後編譯器會為最佳化操作產生二進位程式碼,並將它們寫入共用的物件程式庫。編譯器也會將模型定義和參數儲存至不同的檔案。在執行期間,Neo 執行時間會載入編譯器產生的成品 -- 模型定義、參數和共用的物件程式庫,以便執行模型。

問:我是否需要使用 SageMaker 來訓練我的模型以便使用 Neo 來轉換模型?

不需要。您可以在任何位置訓練模型,並使用 Neo 來將它們針對 SageMaker ML 執行個體或 Greengrass 支援的裝置進行最佳化。 

問:SageMaker Neo 支援哪些模型?

SageMaker Neo 目前支援為電腦視覺應用程式提供動力的最常見度學習模型,以及 Amazon SageMaker 中現今所使用的最受歡迎決策樹模型。Neo 會將在 MXNet 和 TensorFlow 中訓練的 AlexNet、ResNet、VGG、Inception、MobileNet、SqueezeNet 和 DenseNet 模型,以及在 XGBoost 中訓練的分類和隨機分割森林模型的效能最佳化。

問:SageMaker Neo 支援哪些平台?

Neo 目前支援 SageMaker ML.C5、ML.C4、ML.M5、ML.M4,、ML.P3 和 ML.P2 執行個體與 AWS DeepLens、Raspberry Pi 和 Jetson TX1 與 TX2 裝置,以及以 Greengrass 裝置為基礎的 Intel® Atom 和 Intel® Xeon CPU、ARM Cortex-A CPU 和 Nvidia Maxwell 與 Pascal GPU。

問:我是否必須使用目標硬體上支援的特定版本架構?

不需要。開發人員可以使用 SageMaker Neo 容器來執行模型,而不需在架構上安裝相依性。

問:使用 SageMaker Neo 的費用是多少?

您應針對使用 SageMaker Neo 執行推論所使用的 SageMaker ML 執行個體付費。

問:哪些 AWS 區域可以使用 SageMaker Neo?

目前,以下 AWS 區域提供了 SageMaker Neo:維吉尼亞北部、奧勒岡、俄亥俄、愛爾蘭、亞太區域 (東京)、亞太區域 (新加坡)、亞太區域 (雪梨)、亞太區域 (首爾)、亞太區域 (孟買)、亞太區域 (香港)、加拿大 (中部)、歐洲 (法蘭克福)、歐洲 (倫敦)、歐洲 (巴黎)、歐洲 (斯德哥爾摩)、南美洲 (聖保羅) 和美國西部 (加利佛尼亞北部)。

問:什麼是 Amazon SageMaker 模型追蹤?

Amazon SageMaker 模型追蹤可讓您從可能數百和數千個 Amazon SageMaker 模型訓練任務中,快速找到並評估最相關的模型訓練執行項目。SageMaker Search 可透過 AWS 管理主控台,以及 Amazon SageMaker 的 AWS SDK API 提供使用。

問:如何組織並追蹤我的模型訓練執行?

您可以使用模型追蹤功能,依您所選的任何訓練任務屬性,例如訓練任務建立時間、訓練資料集 URI、超級參數值或僅針對任何訓練任務中繼資料,來搜尋和組織您的模型訓練執行。將相關訓練任務組織和群組在一起的彈性方式是對模型訓練任務的標籤使用標記。根據標記搜尋可讓您快速找到與特定業務專案、研究實驗室或資料科學團隊相關聯的模型訓練執行,幫助您有意義地將模型訓練執行分類。

問:如何使用模型追蹤功能建立訓練執行排行榜?

模型訓練任務在 AWS 管理主控台上以表格式呈現,形式與排行榜類似。這包括以可排序的欄呈現的所有超參數和模型訓練指標。您可以按一下欄標題,以針對您選擇的目標績效指標將排行榜排名。您還可以根據訓練損失和驗證準確性之類的效能指標,快速對模型訓練執行項目進行比較和排名,從而使用排行榜挑選「獲勝」模型,以便部署到生產環境中。

問:如何追蹤模型或端點關係?

導覽至 Amazon SageMaker 的 AWS 管理主控台中上的 “Endpoints (端點)”,並從您部署的所有端點清單中選擇端點。然後在所選端點頁面上向下捲動到 “Endpoint Configuration Settings (端點組態設定)”,以查看端點上部署的所有模型版本。在每個模型版本旁邊,您可以看到一開始建立了模型的模型訓練任務的連結。

模型部署

問:我是否能存取執行 Amazon SageMaker 所在的基礎設施?

不行。Amazon SageMaker 會代您操作該運算基礎設施,允許其執行運作狀態檢查、套用安全性修補程式和執行其他例行維護。您還可以在自己的託管環境中,部署那些利用自訂推論程式碼訓練而成的模型成品。

問:如何在生產環境中擴展 Amazon SageMaker 模型的規模和效能?

Amazon SageMaker 託管功能會利用 Application Auto Scaling 自動為您的應用程式擴展所需的效能。另外,您可以修改端點組態,然後就可以手動變更執行個體數量和類型,不用暫停服務。

問:我如何監控 Amazon SageMaker 的生產環境?

Amazon SageMaker 會將效能指標發送到 Amazon CloudWatch 指標,以便您可以追蹤指標,設定警示並自動對生產流量中的更改作出反應。另外,Amazon SageMaker 會將日誌寫入 Amazon Cloudwatch Logs,以便您監控生產環境並排除異常狀況。

問:Amazon SageMaker 可以託管哪種模型?

Amazon SageMaker 可以託管任何符合 Docker 推論影像記載規格的模型。這包括從 Amazon SageMaker 模型成品和推論程式碼建立的模型。

問:Amazon SageMaker 支援的並行即時 API 請求數量是多少?

Amazon SageMaker 旨在擴展到每秒大量的交易。確切的數字會因部署的模型以及模型部署所在的執行個體數量和類型而異。

問:什麼是批次轉換

批次轉換可讓您針對大型或小型批次資料進行預測。無須將資料集分解為多個區塊或管理即時端點。使用簡易的 API 時,您可以請求針對大量資料記錄進行預測,並快速、輕鬆地轉換資料。

進一步了解 Amazon SageMaker 定價

瀏覽定價頁面
準備好開始使用了嗎?
註冊
還有其他問題嗎?
聯絡我們