張貼日期: Aug 27, 2019

Amazon SageMaker 現在支援使用 Amazon Elastic File System (Amazon EFS) 和 Amazon FSx for Lustre 檔案系統作為資料來源,以便在 SageMaker 訓練機器學習模型。Amazon FSx for Lustre 是高效能檔案系統,已針對機器學習、分析和高效能運算等工作負載進行優化。Amazon EFS 為 Linux 工作負載提供簡單、可擴展的彈性檔案系統,可與 AWS 雲端服務和現場部署資源搭配使用。支援這些檔案系統可加速並簡化使用 Amazon SageMaker 透過資料集訓練模型的程序。為了降低啟動時間,檔案系統資料來源免除訓練過程中的資料下載步驟,並利用檔案系統的各種效能和輸送量優點加快執行訓練任務的速度。

以前,Amazon SageMaker 在使用檔案輸入模式時,要在訓練任務開始時以透明的方式從 Amazon S3 下載完整的訓練集到本機檔案儲存。現在有了 Amazon FSx for Lustre,客戶可省去最初的 Amazon S3 下載時間,加快檔案模式訓練任務的速度。當 Amazon FSx for Lustre 檔案系統連結到 Amazon S3 儲存貯體,會在首次存取物件時從 Amazon S3 自動複製物件到檔案系統。相同的 FSx 檔案系統也可用於多個 SageMaker 任務,避免重複下載共同的物件。

以前,客戶只能使用 Amazon SageMaker 搭配存放在 Amazon S3 的訓練集。現在,客戶也可以使用存放在 Amazon EFS 的訓練集。Amazon SageMaker 可與 Amazon EFS 直接互動,無須將資料集從 Amazon EFS 複製到 Amazon S3,即可與 Amazon SageMaker 搭配使用。

大部分 Amazon SageMaker 內建的機器學習演算法都支援使用 EFS 和 FSx for Lustre 作為輸入資料來源。這項功能可在所有提供個別檔案系統的區域使用。如需有關區域可用性的詳細資料,請查看 AWS 區域表

請瀏覽文件了解詳細資訊,以及閱讀部落格文章了解如何使用該功能。