跳至主要內容

Amazon Bedrock AgentCore (預覽版) 定價

依據您的需求量身定製 AgentCore – 混合及搭配服務,獨立使用或併用,並隨著您的 AI 計畫發展,按實際用量付費。

只需按實際用量付費

Amazon Bedrock AgentCore 提供依取用量的靈活定價,不需要預先簽訂合約或支付最低費用。每項服務,包括執行時期、工具 (瀏覽器、程式碼解譯程式)、閘道、身分、記憶體與可觀測性,都能獨立使用或併用,並且您只需按實際用量付費。透過此模組化方法,您可從小型應用程式開始,然後隨 AI 代理程式應用程式發展而進行擴展。

您可於 2025 年 9 月 16 日之前免費試用 AgentCore 服務。使用 AgentCore 時包含的任何其他 AWS 服務均採用標準 AWS 定價 (例如,AgentCore 可觀測性採用 CloudWatch 定價)。自 2025 年 9 月 17 日起,AWS 將按照本頁面依 AgentCore 服務用量計費。

Bedrock AgentCore 服務

執行時期

AgentCore 執行時期是安全、無伺服器執行時期,為部署與擴展動態 AI 代理程式及工具專門建置。

依取用量定價
只需按實際用量付費,而無需預先設定資源。若是 CPU 資源,您的代理程式啟用處理時會對您收費 (若您僅等待 LLM 回應,而非 I/O 等候期間)。若是記憶體資源,只需按代理程式取用的記憶體計費。 

重要詳細資訊:

  • 無需預先選取資源
  • 按秒計費,且使用該秒期間記錄的最高 CPU 及記憶體用量值,最短計費時間為 1 秒
  • 最少以 128MB 計費
  • 透過客戶 ENI 傳送網路資料按標準 EC2 費率計費

瀏覽器

AgentCore 瀏覽器工具提供快捷、安全、以雲端為基礎的瀏覽器執行時期,支援 AI 代理程式大規模地與網站互動。

依取用量定價
只需按實際用量付費,而無需預先設定資源。若是 CPU 資源,僅會在您的工具啟用處理時才會對您收費 (若您僅等待 LLM 回應,而非 I/O 等候期間)。若是記憶體資源,只需按代理程式取用的記憶體計費。

重要詳細資訊:

  • 無需預先選取資源
  • 按秒計費,且使用該秒的最高 CPU 用量值及記憶體用量值,最短計費時間為 1 秒
  • 最少以 128MB 計費
  • 透過客戶 ENI 傳送網路資料按標準 EC2 費率計費

程式碼解譯程式

AgentCore 程式碼解譯程式工具可支援 AI 代理程式在沙盒環境安全地編寫及執行程式碼,從而提升其準確度,並擴展解決複雜的端對端任務的能力。

依取用量定價
只需按實際用量付費,而無需預先設定資源。若是 CPU 資源,僅會在您的工具啟用處理時才會對您收費 (若您僅等待 LLM 回應,而非 I/O 等候期間)。若是記憶體資源,只需按代理程式取用的記憶體計費。

重要詳細資訊:

  • 無需預先選取資源
  • 按秒計費,且使用該秒的最高 CPU 用量值及記憶體用量值,最短計費時間為 1 秒
  • 最少以 128MB 計費
  • 透過客戶 ENI 傳送網路資料按標準 EC2 費率計費 

閘道

AgentCore 閘道針對代理程式提供一種安全的方式來探索及使用工具,並且可輕鬆地將 API、Lambda 函式及現有的服務轉換為與代理程式相容的工具。

依取用量定價
只需按代理程式透過閘道進行的 API 呼叫量計費。依據工具操作 (ListTool 和 InvokeTool)、搜尋查詢及語義搜尋功能索引的工具數目向您收費。 

重要詳細資訊:

  • 不需要預先支付費用或簽訂最低限度合約。
  • ListTool 及 InvokeTool API 以 128 KB 的資料傳輸增量計量

 

身分

AgentCore 身分可簡化代理程式身分及存取管理,讓您的代理程式能夠代表使用者,或經預先授權使用者同意的情況下,自行安全地存取 AWS 資源及第三方工具與服務。

依取用量定價
客戶若透過 AgentCore 執行時期或 AgentCore 閘道使用 AgentCore 身分,不會因其使用 AgentCore 身分而產生任何額外費用。在所有其他情況下,您只需為實際使用量付費,計費方式是根據代理程式向 AgentCore Identity 要求 OAuth 權杖或 API 金鑰的請求次數。

重要詳細資訊:

  • 沒有最低費用,也無需預先簽訂合約
  • 依據成功請求 OAuth 權杖或 API 金鑰,以執行需要授權存取非 AWS 資源的任務進行計費
  • 客戶透過 AgentCore 執行時期或 AgentCore 閘道使用 AgentCore 身分時,不會產生額外費用

記憶體

AgentCore 記憶體可透過消除複雜的記憶體基礎結構管理,同時提供對 AI 代理程式記憶者的全面控制,讓開發人員輕鬆地建置內容感知代理程式。

依取用量定價
您僅需按實際用量付費。我們的定價很簡單且按實際用量付費,與您的 AI 代理程式創造價值的方式相一致:

  1. 短期記憶體按擷取的原始事件數目計費,針對工作階段內的內容,為您提供可預測的費用。
  2. 長期記憶體按每月存放的記憶體數目及擷取的記憶體數目計費,因此僅在代理程式存放及使用持久性知識時才會計費。
  3. 如要從原始事件中擷取長期記憶體,您可在內建記憶體策略中進行選擇,包括自動化處理,或者使用選擇的模型及提示,在帳戶中執行自訂記憶體策略。

重要詳細資訊:

  • 無需預先選取資源
  • 若是短期記憶體,依據建立事件請求計費
  • 若是長期記憶體儲存,依據每天存放的記憶體及當月的平均記憶體計費
  • 若是長期記憶體擷取,依據擷取記憶體請求計費

可觀測性

AgentCore 可觀測性讓開發人員能夠完全深入了解代理程式工作流程,以便追蹤、偵錯及監控 AI 代理程式在生產環境的效能。

依取用量定價
針對代理程式生成、存放及查詢的遙測,您可按使用量付費。在 Amazon CloudWatch 帳戶中擷取及存放遙測資料。依據資料擷取及儲存、擷取及分析資訊的查詢,以及遮罩日誌中敏感性/PII 資料向您收費。如需檢閱定價詳細資訊,請造訪 Amazon CloudWatch 定價頁面。 

定價表

Service
Type
Resource
Price
執行時期

依取用量付費

依取用量付費

CPU

記憶體

每 vCPU-小時 0.0895 USD

每 GB-小時 0.00945 USD

瀏覽器工具

依取用量付費

依取用量付費

CPU

記憶體

每 vCPU-小時 0.0895 USD

每 GB-小時 0.00945 USD

程式碼解譯程式

依取用量付費

依取用量付費

CPU

記憶體

每 vCPU-小時 0.0895 USD

每 GB-小時 0.00945 USD

閘道

依取用量付費

依取用量付費

依取用量付費

API 調用 (ListTool、InvokeTool)

搜尋 API

工具索引

每調用 1,000 次 0.005 USD

每調用 1,000 次 0.025 USD

每月每索引 100 個工具 0.02 USD

身分

依取用量付費

針對非 AWS 資源的權杖或 API 金鑰請求

代理程式每請求 1,000 個字符或 API 金鑰 0.010 USD

(注意:若客戶透過 AgentCore 執行時期或 AgentCore 閘道使用 AgentCore 身分,不需要支付額外費用)

記憶體

依取用量付費

依取用量付費

依取用量付費

短期記憶體

長期記憶體儲存

長期記憶體擷取

每 1,000 個新事件 0.25 USD

使用內建記憶體策略:每月每存放 1,000 個記憶體 0.75 USD

使用自訂記憶體策略:每月每存放 1,000 個記憶體 0.25 USD

每擷取 1000 次記憶體 0.50 USD

可觀測性

依取用量付費

日誌、指標及追蹤

*若是採用自訂記憶體擷取策略,可能會因帳戶中的模型用量而產生額外費用

定價範例

執行時期

範例:客戶支援代理程式部署

您計劃部署一個客服代理程式,用於解決聊天和電子郵件管道中的使用者問題。代理程式處理訂單問題、帳戶驗證及政策澄清。其使用檢索增強生成 (RAG) 來擷取產品政策,以及模型內容通訊協定 (MCP) 相容工具來查詢訂單狀態及更新支援工單。每個代理程式工作階段涉及複雜的多步驟推理,其中包含 1 個向量存放區的 RAG 調用、2 個 MCP 工具呼叫 (例如 OrderAPI、TicketAPI) 以及 2 個 LLM 推理步驟。由於需要完全的工作階段隔離,以及在幾秒內擴展至數百萬工作階段的靈活性,因此您在 AgentCore 執行時期上部署代理程式。

每月處理 1,000 萬個使用者請求,每個工作階段執行 60 秒,且有 70% 的 I/O 等候時間 (即等候 LLM 回應或內部 API 的網路回應)。每個代理程式工作階段在作用中處理期間,持續使用 1vCPU 及 2GB 記憶體。每月費用明細如下所示:

每個工作階段的 CPU 費用:18 秒 (調整為 70% I/O 等候時間) × 1 個 vCPU × (0.0895 USD/3600) = 0.0004475 USD
每個工作階段的記憶體費用:60 秒 × 2 GB × (0.00945 USD/3600) = 0.000315 USD
每個工作階段的總費用:0.0007625 USD
每月總費用:1,000 萬個工作階段 × 0.0007625 USD = 7,625 USD

AgentCore 執行時期採用依取用量付費定價,意味著您僅需按作用中 CPU 處理時間付費,而非 I/O 等候時間,因此相較於傳統運算選項,這具有較高的成本效益。 

瀏覽器

範例:自動化旅行預訂系統

您打算建立旅行預訂 AI 代理程式,並透過 Web 互動來自動執行完整行程規劃及預訂。您的實作要求 AgentCore 瀏覽器的安全、無伺服器執行時期,來動態管理無周邊瀏覽器,以搜尋航班、旅館,模擬點擊量,擷取擷取,以及提交預訂表單。AgentCore 瀏覽器工具提供各種企業級功能,包括工作階段隔離的沙盒運算,以及透過即時視觀表與工作階段重播的綜合可觀測性。

代理程式每月處理 10 萬個請求。每個瀏覽器工作階段執行 10 分鐘,包含 80% 的 I/O 等候時間,並在作用中處理期間持續使用 2個 vCPU 及 4GB 記憶體。每月費用明細如下所示:

每個工作階段的 CPU 費用:120 秒 (調整為 80% I/O 等候時間) × 2 個 vCPU × (0.0895 USD/3600) = 0.005967 USD
每個工作階段的記憶體費用:600 秒 × 4 GB × (0.00945 USD/3600) = 0.0063 USD
每個工作階段的總費用:0.012267 USD
每月總費用:10 萬個工作階段 × 0.012267 USD = 1,226.67 USD

程式碼解譯程式

範例:自然語言資料分析自動化

您打算部署資料分析師代理程式,以便支援業務及產品團隊進行資料集查詢、視覺化與統計分析,這一切均透過自然語言實現。您的代理程式可動態生成並執行 Python 程式碼,以便處理網站流量與轉換率間的關聯分析等複雜請求。您可善用 AgentCore 程式碼解譯程式,因為其提供符合企業級安全性政策要求的隔離式沙盒環境、支援多種語言 (JavaScript、TypeScript、Python) 的預先建置執行時期,以及大型檔案支援。

代理程式每月處理 1 萬個請求,且每個請求執行 3 次程式碼。每此執行運作 2 分鐘,包含 60% 的 I/O 等候時間,並在作用中處理期間持續使用 2個 vCPU 及 4GB 記憶體。每月費用明細如下所示:

每個工作階段的 CPU 費用:48 秒 (調整為 60% I/O 等候時間) × 2 個 vCPU × (0.0895 USD/3600) = 0.002387 USD
每個工作階段的記憶體費用:120 秒 × 4 GB × (0.00945 USD/3600) = 0.00126 USD
每個工作階段的總費用:0.003647 USD
每月總費用:3 萬次執行 × 0.003647 USD = 109.40 USD

閘道

範例:將 HR 助理代理程式連線至內部工具

您打算針對中型企業建置 HR 助理代理程式,從而處理內部政策問題、假期餘額、福利登記及薪資查詢。如要處理使用者請求,代理程式需存取多個內部系統 (入職、福利、薪資及休假管理 API) 來做為工具。您已使用 AgentCore 閘道,針對 200 個內部工具建立 MCP 伺服器,且您無需編寫任何程式碼,代理程式均可隨時隨地互動。如需改善工具使用準確度,您善用搜尋功能對工具中繼資料進行索引,並在代理程式調用期間,依據互動內容來啟用工具的動態比對。

每個代理程式互動需要調用 1 次搜尋 API 和 4 次 InvokeTool API。每月 5,000 萬次互動產生 5,000 萬次搜尋和 2 億次 InvokeTool 呼叫。每月費用明細如下所示:

SearchToolIndex 費用:200 個工具 × 每 100 個工具 0.02 USD = 0.04 USD
搜尋 API 費用:5,000 萬 × 25 USD/百萬 = 1,250 USD
InvokeTool API 費用:2 億 × 5 USD/百萬 = 1,000 USD
每月總計︰2,250.04 USD

身分

範例:安全客戶支援存取管理

您打算運作客戶支援代理程式,藉由存取多種工具來為技術團隊提供協助 – 使用 Slack 進行支援對話、使用 Zoom 擷取呼叫日誌,以及使用 GitHub 追蹤問題及提交日誌。您的實作利用 AgentCore 身分「代表」使用者或支援工程師進行安全、委派性存取。系統與現有的身分提供者 (例如 Okta,Microsoft Entra ID,Amazon Cognito) 相容,並且管理從 OAuth 權杖到 IAM 角色的所有驗證方法,從而無需自訂安全基礎結構。

假設每月有 1 萬個作用中使用者在使用代理程式,每位使用者平均進行 5 次互動,每個每位使用者的每個工作階段需要存取 3 次工具,則您的每月費用明細如下所示:

請求的字符總計:1 萬個使用者 × 5 個工作階段 × 3 個工具 = 15 萬個字符
每月總計:15 萬個請求 × 0.010 USD/1,000 = 1.50 USD

注意:若使用 AgentCore 執行時期或閘道,納入 AgentCore 身分無需額外費用。

記憶體

範例:個人化編碼助理代理程式實作

您打算開發一款編碼助理代理程式,可協助軟體工程師在 IDE 及終端編寫、偵錯及重構程式碼。若要提供個人化體驗,代理程式需要在工作階段期間維護內容,並且記住多個工作階段的使用者喜好設定。您的實作利用 AgentCore 記憶體,為代理程式配備短期記憶體 (即時對話及事件) 與長期記憶體 (跨工作階段的持續知識)。

使用者每次與代理程式互動 (例如,傳送程式碼片段或提出編碼問題),您將事件傳送至 AgentCore 記憶體,以便做為短期記憶體存放。針對長期記憶體,您設定了內建擷取策略,以便跨工作階段自動擷取及存放偵錯工作階段及使用者偏好設定的摘要。代理程式隨後可擷取這些長期記憶,以便為開發人員提供個人化體驗。

每月有 10 萬個短期記憶事件、1 萬個存放的長期記憶體,以及 2 萬次記憶體擷取,您的費用明細如下所示:

短期記憶體:10 萬個事件 × 25 USD/1,000 = 25 USD
長期記憶體儲存:1 萬個記憶體 × 0.75 USD/1,000 = 7.50 USD
長期記憶體擷取:2 萬次擷取 × 0.50 USD/1,000 = 10 USD
每月總計︰42.50 USD

注意:使用自訂擷取策略時,由於您帳戶中的模型用量可能會產生額外費用,長期儲存費用每 1000 個儲存記憶體將降低 0.25 USD。

可觀測性

若要了解 AgentCore 可觀測性定價範例,請參閱這裡的 CloudWatch 定價。