SageMaker Canvas 解鎖 PB 級無程式碼 ML 和資料準備
Amazon SageMaker Canvas 現在支援 PB 級資料集,讓企業能夠充分利用其資料的潛力。從今天開始,您可以互動式地準備大型資料集、建立端對端資料流,以及在 PB 上觸發 AutoML 實驗,這與之前的 5GB 限制相比有了大幅的提升。Canvas 擁有 50 多個連接器、直覺式的「與資料聊天」介面和 PB 支援,提供可擴展性、低程式碼/無程式碼的 ML 解決方案,用於處理真實的企業使用案例。
從今天開始,Canvas 為您提供了新的取樣技術 (如隨機取樣和分層取樣等),允許取樣多達 20 萬列的樣本,比之前增加了十倍。這使您可以在處理整個資料集之前,輕鬆收集資料品質見解並以互動方式了解資料轉換的影響,充分利用我們與 EMR Serverless 的全新無縫整合。Canvas 會自動將超過 5GB 的資料在取樣、準備、模型建置和推論的過程中,擴展至 EMR Serverless,從而透過直覺式體驗釋放資料的全部預測性潛力。使用 EMR Serverless 會產生額外 EMR 定價成本。
在提供 SageMaker Canvas 的所有 AWS 區域中,均提供全新的 PB 支援和改進的互動式體驗。
若要開始使用無程式碼 ML 和大型資料集的資料準備,請使用我們的技術文件在 Canvas 網域和使用者設定檔中啟用「大型資料處理組態」,並從 AWS Machine Learning 部落格了解如何使用新功能。現有使用者應依據文件更新其 SageMaker 網域設定、從 Canvas 工作區登出,並重新登入以存取最新版本。