Amazon SageMaker Canvas 現在支援資料流程匯入,並可更快速地準備用於 ML 的資料
Amazon SageMaker Canvas 中的 Amazon SageMaker Data Wrangler 現在支援從 Amazon SageMaker Studio Classic 匯入資料流程,以及更快速且更靈活的為機器學習 (ML) 準備資料。有了 SageMaker Canvas 中的最新版 SageMaker Data Wrangler,您現在可以使用自訂分隔符和額外取樣選項來更輕鬆地從 S3 匯入資料,並以更高的效能來準備資料。此外,您還可以更快速地驗證轉換,並輕鬆地對資料配方進行迭代。您也可以從 SageMaker Studio Classic 匯入資料流程,利用 SageMaker Canvas 中的最新資料準備功能和增強功能。
匯總、分析和轉換大量資料是具有高度迭代性和重複性的過程,因此是 ML 專案中最耗時的工作。有了這些全新的增強功能,您將可使用不同的取樣方法 (例如 top-k、隨機或分層) 匯入資料,並根據需要調整樣本大小和方法,以獲得代表性樣本。您能夠以較低的延遲轉換資料、快速驗證轉換對資料大小的影響,並根據需要重新排序步驟。此外,您也可複製資料配方並取代資料來源,將其重複用於不同的資料集和模型。最後但同樣重要的是,您只需一鍵,即可從 SageMaker Studio Classic 中的 SageMaker Data Wrangler 將所有現有資料流程匯入至 SageMaker Canvas,或者透過 S3 或本機文件上傳,手動匯入特定的資料流程。
這些增強的資料準備功能適用於所有支援 SageMaker Canvas 的 AWS 區域。如需詳細資訊,請參閱部落格和 AWS 技術文件。