使用雲端中全受管 Jupyter 筆記本快速入門機器學習開發。
透過雲端中最廣泛應用的運算最佳化和 GPU 加速執行個體,來擴展或縮減您的運算資源。
透過一起編輯相同的筆記本,在機器學習生命週期的所有步驟中與團隊高效協作。
透過對 Spark、NumPy 和 Scikit-learn 等流行架構和套件的最佳化,將資料轉化為洞見的速度提高 2 倍。
Amazon SageMaker 提供兩種全受管 Jupyter 筆記本,用於探索資料和建置機器學習模型:Amazon SageMaker Studio 筆記本和 Amazon SageMaker 筆記本執行個體。
SageMaker Studio 筆記本
快速入門,與 SageMaker 和其他 AWS 服務中的專用機器學習工具整合的協作筆記本,用於完整的機器學習開發,從使用 Amazon EMR 上的 Spark 準備 PB 級資料,到訓練和偵錯模型、追蹤實驗、部署和監控模型和管理管道,全部在 Amazon SageMaker Studio 中,一個適用於機器學習的完全整合式開發環境 (IDE)。在不中斷工作的情況下,輕鬆地擴展或縮減運算資源。使用可共享的連結輕鬆與您的團隊共享筆記本,甚至可以同時共同編輯單一筆記本。
Amazon SageMaker 筆記本執行個體
Amazon SageMaker 主控台中的獨立、全受管 Jupyter 筆記本執行個體。從雲端中可用的最廣泛應用的運算資源中進行選擇,包括用於加速運算的 GPU,並使用您信任的最新版本開放原始碼軟體。
運作方式
-
SageMaker Studio 筆記本
-
SageMaker 筆記本執行個體
-
SageMaker Studio 筆記本
-
-
SageMaker 筆記本執行個體
-
主要功能
SageMaker Studio 筆記本
SageMaker 筆記本執行個體
快速入門
快速存取 Studio 中的全受管 Jupyter 筆記本。SageMaker Studio 筆記本已針對完成 AWS 最佳化的 TensorFlow 和 PyTorch 預先設定好深度學習環境,可協助您開始建置模型。
雲端中熟悉的 Jupyter 筆記本
在全受管 SageMaker 服務中使用您了解並信任的 Jupyter 和 JupyterLab 筆記本。不再有設定運算資源、升級資料科學和機器學習套件以及套用安全修補的麻煩。SageMaker 筆記本執行個體讓您可以完全專注於機器學習,同時確保您的運算環境安全並裝有最新的開放原始碼軟體。
大規模準備資料
使用適用於資料工程、分析和機器學習的統一筆記本環境來簡化您的資料工作流程。直接從 SageMaker Studio 筆記本建立、瀏覽和連接至 Amazon EMR 叢集和 AWS Glue 互動式工作階段。直接從筆記本內使用 Spark UI 等熟悉工具來監控和偵錯 Spark 任務。直接從筆記本中使用採用 Amazon SageMaker Data Wrangler 技術的內建資料準備功能,來視覺化資料、識別資料品質問題並套用推薦的解決方案,以提高資料品質和模型準確性,而無需編寫任何程式碼。
取得 AWS 效能與規模
透過 AWS 針對效能進行最佳化的預先封裝資料科學和機器學習架構,縮短從資料到洞見所需的時間。透過從雲端中最廣泛應用的運算優化和 GPU 加速的執行個體中選取來擴展您的資源。使用內建的 SageMaker Python SDK 在 SageMaker 上訓練和部署模型。在 Amazon CloudWatch 中取得 Jupyter 日誌以追蹤事件和指標、偵測異常行為、設定警示並發現使用模式。
Elastic Compute
擴充或縮減基礎運算資源,並使用共享持久性儲存切換運算,所有這些動作都不會中斷您的工作。從 AWS 提供的最廣泛應用的運算資源選擇中進行選擇,包括最強大的機器學習 GPU 執行個體。
得到啟發
正在尋找如何建置的想法嗎? 您的筆記本執行個體包含 SageMaker 提供的 200 多本範例筆記本,以及顯示如何使用 SageMaker 套用機器學習解決方案的程式碼。
筆記本程式碼至生產就緒任務的自動轉換
選取筆記本後,SageMaker Studio 筆記本會拍攝整個筆記本的快照,將其相依項封裝到容器中,建置基礎設施,按照從業者設定的排程將筆記本作為自動化任務執行,並在任務完成時取消佈建基礎設施,從而將筆記本投入生產所需的時間從數週縮短至幾小時。
為團隊而建置
使用 AWS IAM Identity Center (AWS Single Sign-on 的後繼者) 設定您的團隊對 SageMaker Studio 筆記本的存取權限。為平台管理員和業務主管建立不同的環境,以監控 SageMaker Studio 的成本和用量。建立共享空間,您的團隊可以在其中一起即時閱讀、編輯和執行筆記本,以簡化協作和溝通。團隊成員可以一起檢閱結果,以立即了解模型的執行狀況,而無需來回傳遞資訊。藉由對 BitBucket 和 AWS CodeCommit 等服務的內建支援,團隊可以輕鬆管理不同的筆記本版本,對隨時間發生的變更進行比較。所有資源都會自動標記,從而可以更輕鬆地使用 AWS Budgets 和 AWS Cost Explorer 等工具監控成本和規劃預算。
可自訂
使用自訂 Docker 映像檔將您自己的筆記本開發環境帶入 SageMaker Studio。使用生命週期組態為您的團隊實現自動化和自訂筆記本環境。例如,您可以安裝自訂套件和筆記本擴充功能、預先載入資料集以及自動關閉閒置執行個體。
客戶

使用 Amazon SageMaker Studio 之後,AstraZeneca 能夠迅速部署解決方案來分析大量資料,一方面加快洞察速度,一方面又能讓其資料科學家減少手動工作負載,這一點對於 AstraZeneca 的使命 (探索和發展能夠改變全球人類生活的藥物) 至關重要。
「我們可以直接在 Amazon SageMaker Studio 內自動進行大多數的機器學習開發程序,而不必建立許多人工作業程序。」
AstraZeneca 的全球資深企業架構師 Cherry Cabading

「我們很高興我們的 Vanguard 資料科學家和資料工程師現在可以在單一筆記本中協作進行分析和機器學習。現在 Amazon SageMaker Studio 與 Spark、Hive 和 Presto 進行內建整合,這些內建整合都在 Amazon EMR 上執行,讓我們的開發團隊可以提高生產力。這種單一的開發環境將讓我們的團隊能夠專注於建置、訓練和部署機器學習模型。」
Vanguard 資料與分析資深總監 Doug Stewart

「我們一直在等待直接從 Amazon SageMaker Studio 建立和管理 Amazon EMR 叢集的功能,以便我們的客戶可以直接從 Amazon SageMaker Studio 筆記本執行 Spark、Hive 和 Presto 工作流程。我們很高興 Amazon SageMaker 現在原生建置了此功能來簡化 Spark 和機器學習任務的管理。這將幫助我們客戶的資料工程師和資料科學家更高效地協作,以執行互動式資料分析,並開發以 EMR 為基礎的資料轉換的機器學習管道。」
Provectus 執行長 (CEO) Stepan Pushkarev