- 機器學習›
- Amazon SageMaker AI›
- Amazon SageMaker 與 MLflow
利用 Amazon SageMaker AI 和 MLflow 來加速生成式 AI 開發
無需基礎架構管理即可追蹤實驗、評估模型及追蹤 AI 應用程式
為什麼應搭配使用 Amazon SageMaker AI 與 MLflow?
建置和自訂 AI 模型是一個迭代過程,涉及數百個訓練執行,以找到最佳演算法、架構和參數來達成最佳模型準確度。Amazon SageMaker AI 提供受管理的無伺服器 MLflow 功能,可讓 AI 開發人員輕鬆追蹤實驗,觀察行為,以及評估其 AI 模型和應用程式的效能,而無需管理任何基礎架構。搭配 MLflow 的 SageMaker AI 也可與熟悉的 SageMaker AI 模型開發工具整合,例如 SageMaker AI JumpStart、模型註冊庫、管道和無伺服器模型自訂功能,以協助您連接 AI 生命週期的每個步驟 - 從實驗到部署。
Amazon SageMaker AI 搭配 MLflow 的優勢
開始跟蹤實驗並追蹤 AI 應用程式,無需佈建基礎架構,也無需設定追蹤伺服器。AI 開發人員可立即存取無伺服器 MLflow 功能,讓您的團隊能夠專注於建置 AI 應用程式,而非管理基礎架構。
無論是執行單一實驗還是管理數百個並行微調工作,具有 MLflow 的 SageMaker AI 都會自動擴展以符合您的需求。MLflow 可在密集的實驗爆發期間調整您的基礎架構,並在安靜期縮減規模,無需手動干預,能夠保持一致的效能,沒有管理伺服器的操作負擔。
藉助單一介面,您可以視覺化進度中的訓練任務、在實驗期間與團隊成員協作,並維護每個模型和應用程式的版本控制。MLflow 還提供進階追蹤功能,協助您快速識別錯誤或意外行為的源頭。
隨著 MLflow 專案的發展,SageMaker AI 客戶將繼續從開放原始碼社群創新中受益,同時享受 AWS 的無伺服器支援。
具有 MLflow 的 Amazon SageMaker AI 會自動升級至最新版本的 MLflow,讓您無需維護時間或遷移工作,即可存取最新特性和功能。
簡化 AI 模型自訂
使用 SageMaker AI 上的 MLflow,可以追蹤、組織和比較實驗,以確定表現最佳的模型。MLflow 可與 Amazon SageMaker AI 無伺服器模型自訂功能整合,適用於 Amazon Nova、Llama、Qwen、DeepSeek 和 GPT-OSS 等熱門模型,讓您透過單一介面來視覺化進行中的訓練任務和評估。
透過提示管理來保持一致性
您可以使用 MLflow Prompt Registry 來簡化 AI 應用程式中的提示工程和管理,這是一項強大的功能,可讓您在整個組織中對提示進行版本控制、追蹤和重複使用,從而幫助維持一致性並改善提示開發中的協作。
實時追蹤 AI 應用程式和代理程式
具有 MLflow 的 SageMaker AI 會記錄在 AI 開發的每個步驟中的輸入、輸出和中繼資料,以快速識別錯誤或意外行為。透過針對代理工作流程和多步驟應用程式的進階追蹤功能,您將獲得偵錯複雜的生成式 AI 系統並最佳化效能所需的可見性。
使用 SageMaker Model Registry 集中管理模型
組織需要簡單的方法來追蹤開發團隊的所有候選模型,以明智決定哪些模型要進行生產。受管的 MLflow 包含專門建置的整合,可自動將 MLflow 中註冊的模型與 SageMaker Model Registry 同步。這能夠讓 AI 模型開發團隊使用不同工具進行各自的工作:MLflow 負責實驗、SageMaker Model Registry 負責以全面的模型譜系管理生產生命週期。
將模型無縫部署到 SageMaker AI 端點
達到所需的模型準確度和效能目標後,只需按幾下即可將模型從 SageMaker Model Registry 部署到 SageMaker AI 推論端點。這種無縫整合消除了為模型存儲建置自訂容器的需要,並允許客戶利用 SageMaker AI 最佳化的推論容器,同時保留 MLflow 用於記錄和註冊模型的使用者友好體驗。
野生動物保護協會
「野生動物保護協會正在透過 MERMAID 推動全球珊瑚礁保護,這是一個使用 ML 模型來分析世界各地科學家的珊瑚礁照片的開放原始碼平台。當我們的基礎架構需求發生變化時,無需設定 MLflow 追蹤伺服器或管理容量,具有 MLflow 的 Amazon SageMaker 提升了我們的生產力。透過讓我們的團隊完全專注於模型創新,我們加快了部署時間,為海洋科學家和管理者提供關鍵雲端驅動的洞察。」
Kim Fisher, MERMAID
WCS 首席軟體工程師