Amazon SageMaker AI 現在支援適用於推論的彈性訓練計畫處理能力
張貼日期:
2025年11月26日
Amazon SageMaker AI 的彈性訓練計畫 (FTP) 現在支援推論端點,能夠為客戶提供保證可用的 GPU 處理能力,以用於計劃的評估並應對生產高峰。現在,客戶能夠在無需自行管理任何基礎結構的情況下,保留所需的確切執行個體類型,並由 SageMaker AI 自動啟動推論端點。
在客戶規劃 ML 開發週期時,他們需要確定能夠在所需的確切日期存取用於模型評估和生產前測試的 GPU。FTP 可讓客戶輕鬆存取用於執行 ML 工作負載的 GPU 處理能力。有了推論端點的 FTP 支援,您可以為推論工作負載選擇偏好的執行個體類型、運算需求、保留時長和開始日期。您只需在建立端點時參考預留 ARN,SageMaker AI 就會自動佈建端點,並在整個計畫期間以所保證的處理能力執行該端點。這種做法能夠省去數週的基礎結構管理和排程工作,讓您以可預期的方式執行推論,同時將時間專注於改善模型效能。
SageMaker AI 推論的彈性訓練計畫支援於以下區域推出:美國東部 (維吉尼亞北部)、美國西部 (奧勒岡)、美國東部 (俄亥俄)。
若要進一步了解如何使用 FTP 保留作為推論端點,請參閱這裡的 SageMaker AI 推論 API 參考。