Amazon Bedrock

Amazon Bedrock 定價

免費開始使用

請求定價報價

定價概觀

Amazon Bedrock 是一個全方位平台，用於建置生成式 AI 應用程式和代理程式，可存取領先的基礎模型、部署和操作代理程式的服務，以及用於自訂、保護和最佳化應用程式的工具。

Amazon Bedrock 為模型推論提供靈活的定價選項，以最佳化成本，同時平衡速度、規模和模型存取需求。這包含了隨用隨付的定價模式，無需提前承諾任何費用；也可選擇批量處理模式，以更具成本效益的方式處理大量輸入資料。AgentCore 提供靈活、消費型定價，無需提前承諾或最低費用，您可以透過 AgentCore 定價頁面來了解這些資訊。

服務方案和模型匯入

標準方案為日常 AI 任務提供一致效能，,並以正常費率計費。有了標準方案，您只需為用量付費，而無需基於時間的期限承諾。針對文字生成模型，處理的每個輸入字符和生成的每個輸出字符都會向您收費。針對嵌入模型，處理的每個輸入字符都會向您收費。字符由幾個字元組成，是指模型學習了解使用者輸入和提示的基本文字單元。針對影像生成模型，每個生成的影像都會向您收費。

進一步了解

Priority 方案是一個進階服務方案，可為關鍵任務應用程式提供優先的運算分配。此服務方案的定價比標準方案高。與標準方案相比，客戶能夠在支援 Priority 方案的大多數模型上降低高達 25% 的每秒輸出字符 (OTPS) 延遲。

進一步了解

Flex 方案為可以透過即時處理換取成本效益的工作負載，提供折扣後的標準定價。非常適合非緊急 AI 工作負載。

使用批次模式，您可以提供一組提示作為單一輸入檔案，並接收回應作為單一輸出檔案，讓您能夠同時獲得大規模預測。回應已經過處理並儲存在 Amazon S3 儲存貯體中，以便您稍後存取。Amazon Bedrock 提供 Anthropic、Meta、Mistral AI 和 Amazon 等領先 AI 供應商提供的精選基礎模型 (FM)，相較於隨需推論定價，能夠以低一半的價格獲得批次推論。請參閱此處的模型清單。

自訂模型匯入可讓您利用在 Amazon Bedrock 內開發的舊有自訂模型，並像使用 Bedrock 現有的託管基礎模型一樣，以全受管方式使用它們。您可以匯入受支援模型架構的自訂權重，並使用隨需模式來提供自訂模型。將自訂模型導入 Bedrock 無需費用。匯入模型後，您即可隨需存取模型，而無需執行任何控制平面動作。僅依據服務推論磁碟區所需的自訂模型副本數目，以及每個模型副本出於作用中的持續時間 (以 5 分鐘時段計費)，才會向您收取模型推論費用。模型副本是匯入模型的單一執行個體，可隨時提供推論請求。每分鐘模型副本的價格取決於架構、內容長度、AWS 區域、運算單位版本 (硬體產生) 等因素，並依模型副本大小進行分級。

自訂與最佳化

強化微調
利用 Amazon Bedrock 的強化微調功能，您無需深度機器學習專業知識或大量的已標記資料，就能提高模型準確度。Amazon Bedrock 自動執行強化微調工作流程：它會採取您的範例提示、生成模型回應，並使用獎勵函數對其進行評分。然後，即可利用這些提示、回應和分數，透過迭代 RFT 工作流程來訓練您的自訂模型。整個工作流程將按小時費率計費。您可以透過建立自訂模型隨需部署，在自訂模型上設定推論。隨需推論選項包括基於字符的定價模型，該定價模型會根據推論期間處理的字符數量收費。

監督式微調
透過 Amazon Bedrock 中的監督式微調，您可以使用資料自訂 FM，以針對特定任務和業務環境提供量身打造的回應。您可以使用已標記資料微調模型。對於文字生成模型的自訂，您必須根據模型處理的總字符數量 (訓練資料語料庫中的字符數量乘以 epoch 數量) 支付模型訓練費用，並依照每個模型每月支付模型儲存費用。epoch 是指在微調或持續預先訓練過程中，對訓練資料集進行的一次完整傳遞。

模型蒸餾
利用 Amazon Bedrock 模型蒸餾功能，您可以將知識從功能更強大的模型 (稱為「教師模型」) 傳輸到更小、更快且更具成本效益的模型 (稱為「學生模型」)，從而使學生模型在特定使用案例中的表現與教師模型一樣出色。在使用 Amazon Bedrock 模型蒸餾功能時，您需按實際用量付費。蒸餾功能是一個兩步驟的流程，其首先先從教師模型產生合成資料，然後訓練學生模型。合成資料生成功能會按照所選教師模型的隨選定價收費。學生模型的微調任務會按照模型自訂 (監督式微調) 費率收費。

對於監督式微調和模型蒸餾，您可以根據您的特定工作負載需求和成本目標建立自訂模型隨需部署，或購買「佈建輸送量」來設定自訂模型上的推論。隨需推論選項包括基於字符的定價模型，該定價模型會根據推論期間處理的字符數量收費。若購買「佈建輸送量」，模型單元可在無承諾期限的情況下，用於對自訂模型進行推論。我們會根據您用於自訂模型推論的第一個模型單元的小時數向您收費。如果您想將輸送量提高到超過一個模型單元，則必須購買 1 個月或 6 個月的承諾期限。

有了 Amazon Bedrock 上的提示快取功能，您可以快取 API 呼叫中的重複情境，降低成本和回應延遲。提示通常包含常見的情境或前綴，例如較長的多輪交談、多樣範例，以及可精簡模型行為的詳細指示。透過現有的 Amazon Bedrock API，您可以在 AWS 帳戶特定的快取中指定您希望快取五分鐘的提示前綴。在此期間，任何具有相符前綴的請求都可以在快取字符時獲得高達 90% 的折扣，且延遲情況得到高達 85% 的改善。價格和效能的改進情況會因模型和提示長度而有所不同，但您的快取始終會限定在您的 AWS 帳戶內。

Amazon Bedrock 提示管理透過直觀的 UI 和一組 API，來加速建立、測試和執行提示。您可以輕鬆測試提示和建立版本，比較不同的變體，並在安全的無伺服器基礎設施中執行。

Amazon Bedrock 中的提示最佳化功能會自動重寫提示，以獲得更出色的效能和更簡潔的基礎模型回應。該功能與提示管理整合，可並排比較原始版本和最佳化版本，以及進行提示生命週期管理。您還可在 Bedrock Playground 中，或直接透過 API 使用提示最佳化。

工具

Amazon Bedrock 防護機制是主要雲端供應商提供的唯一負責任的 AI 原則功能，可協助您為生成式 AI 應用程式建置和自訂安全性、隱私權和真實性保障措施。它會依據特定使用案例政策評估使用者輸入與模型回應，在原生功能提供的防護基礎上，額外增加一層防護機制。防護機制的措施可套用至以下對象：透過 Amazon Bedrock 託管的模型，或透過 ApplyGuardrail API 套用至任何第三方模型 (如 OpenAI 和 Google Gemini)。您也可將防護機制與代理架構 (如 Strands Agents) 搭配使用，包括透過 Amazon Bedrock AgentCore 部署的代理程式。防護機制透過兩種方式協助過濾幻覺內容並提升事實準確性：一是針對 RAG 內容執行「上下文基礎檢查」，二是透過「自動推理檢查」，最終提供可驗證的真實回應。

Amazon Bedrock 知識庫是一種全受管檢索增強生成 (RAG) 工作流程，可讓客戶透過結合自己的資料來源中的情境資訊，建立高度準確、低延遲、安全且自訂的生成式 AI 應用程式。其目前處於預覽狀態，支援各種資料來源，包括 S3 和 Confluence、Salesforce 和 SharePoint。Amazon Bedrock 知識庫還提供可用於串流資料的文件擷取功能。Bedrock 知識庫會將非結構化資料轉換為嵌入，將其儲存在向量資料庫中，並且能夠讓您從各種資料存放區進行擷取。其還與 Kendra 整合，可進行受管的檢索，並支援使用自然語言到 SQL 的結構化資料檢索。

Amazon Bedrock 資料自動化會將非結構化的多模態內容轉換為結構化資料格式，適用於智慧型文件處理、影片分析和 RAG 等使用案例。Bedrock 資料自動化可以使用預先定義的預設項目來生成「標準輸出」內容，這些預設項目為模態特定的項目，例如影片的逐段場景描述、音訊轉錄或自動文檔分析。客戶還能夠根據可輕鬆載入現有資料庫或資料倉儲的自有資料結構描述，在藍圖中指定其輸出需求來建立「自訂輸出」。透過與知識庫整合，Bedrock 資料自動化也可以用於剖析 RAG 應用程式的內容，從而透過包括嵌入影像和文字中的資訊來提高結果的準確性和相關性。

Amazon Bedrock Flows 是適用於生成式 AI 應用程式的 Bedrock 工作流程編寫和執行特徵。該功能透過直觀的視覺化產生器和一組 API，加速使用者定義生成式 AI 工作流程的建立、測試和部署。它可讓您順暢地連結最新的基礎模型、提示、代理程式、知識庫、防護機制和 AWS 服務 (例如 Amazon Lex、AWS Lambda、Amazon S3) 以及業務邏輯，從而建置生成式 AI 工作流程。您可以輕鬆測試和版本化工作流程，並透過視覺化介面或 API 在安全的無伺服器環境中執行工作流程，而無需建立自己的基礎設施。

模型評估：使用 Amazon Bedrock 模型評估，您可以根據實際使用量付費，而無需事先承諾提示或回應的最小數量。對於自動評估 (程式設計式)，您只需支付評估中所選模型的推論費用。自動生成的演算法分數為免費提供。在自動 (模型/LLM 即評審) 評估時，您只需根據您選擇的生成器模型和評估器模型支付推論費用。在 LLM 即評審模型評估工作中，內建指標會使用針對每個指標和可用的評判模型獨有的系統評判提示範本，這些模型將作為記號用量的一部分進行收費，而評判提示則可在公開的 AWS 文件中找到，以確保透明度。對於您自帶工作團隊的人工評估，您需要支付評估中的模型推論費用，以及每完成一項人工任務 0.21 USD 的費用。人工任務定義為當人類工作者在人工評估使用者介面，提交單一提示及其相關推論回應的評估時發生的事件。無論您在評估任務中有一個還是兩個模型，每個任務的價格都相同，包含的評估指標和評分方法均不受影響。人工任務費用會顯示在 AWS 帳單中的 Amazon SageMaker 區段中，且所有 AWS 區域均相同。由於人力由您提供，所以人力無需另外收費。如果您在評估作業期間使用「自帶推論回應」特徵而不是呼叫 Bedrock 模型，則您只需支付評估者模型推論費用 (LLM 即評審工作) 或每個完成的人工任務 0.21 美元 (人工評估工作)。針對 AWS 管理的評估，在與 AWS 專家評估團隊合作時，定價依私人參與中的評估需求自訂。

RAG 評估：使用 Amazon Bedrock RAG 評估，您就可以根據實際使用量付費，而無需事先承諾提示或回應的最小數量。如果您正在評估 Amazon Bedrock 知識庫，您只需根據您選擇的生成器模型和評估器模型支付推論費用 (評估工作使用 LLM 即評審)，以及根據 Amazon Bedrock 知識庫定價支付在評估工作中使用知識庫而產生的任何費用。如果您使用「自帶推論回應」特徵，則只需為評估者模型推論付費。在 RAG 工作中，內建指標會使用針對每個指標和可用的評判模型獨有的系統評判提示範本，這些模型將作為記號用量的一部分進行收費，而評判提示則可在公開的 AWS 文件中找到，以確保透明度。某些指標除了輸入提示之外，還有對從知識庫/RAG 擷取的內容或 Ground Truth 答案進行的評估模型推論，這會影響與每個指標相關的成本。如需每個指標的詳細資訊，請參閱適用於評估的公開 AWS 文件。

模型定價詳細資訊

定價取決於模式、供應商和模型。請選擇模型供應商以查看詳細定價。

Amazon Bedrock 提供 Anthropic、Meta、Mistral AI 和 Amazon 等領先 AI 供應商提供的精選基礎模型 (FM)，相較於隨需推論定價，能夠以低一半的價格獲得批次推論。請參閱此處的模型清單。

AI21 Labs
AI21 Labs

隨需定價
Amazon
- Amazon Nova
- Amazon Titan
- 其他 Amazon
- Amazon Nova
- Amazon Nova
  
  理解模型的定價
  
  全球跨區域推論
  
  地理跨區域推論與區域內
  
  內建工具
  
  創意內容生成模型的定價
  
  語音理解和生成模型的定價
  
  語音轉換語音基礎模型的隨需定價
  
  注意：*文字字符輸入和輸出定價適用於特定的使用案例，例如語音轉換文字轉錄，工具呼叫完成任務或知識基礎，在工作階段中新增對話歷史記錄等。
  
  自訂 Nova 模型隨需推論的價格與基本 Nova 推論相同。
  
  嵌入模型的定價
- Amazon Titan
- Amazon Titan
- 其他 Amazon
Anthropic

Anthropic

隨需和批次定價

具有擴充存取權的模型

供應商	模型名稱	區域	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價	每 1,000 個輸入字符的定價 (批次)	每 1,000 個輸出字符的定價 (批次)	每 1,000 個輸入字符的定價 (快取寫入)	每 1,000 個輸入字符的定價 (快取讀取)
Anthropic	Claude 3.5 Sonnet (公開的擴充存取權，2025 年 12 月 1 日生效)	美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (奧勒岡)、歐洲 (法蘭克福)、歐洲 (愛爾蘭)、歐洲 (蘇黎世)、歐洲 (巴黎)	0.006 USD	0.03 USD	0.003 USD	0.015 USD	無	無
Anthropic	Claude 3.5 Sonnet v2 (公開的擴充存取權，2025 年 12 月 1 日生效)	美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (奧勒岡)	0.006 USD	0.03 USD	0.003 USD	0.015 USD	0.0075 USD	0.0006 USD

延遲最佳化推論

佈建輸送量定價

區域：美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

Anthropic 模型	每個模型每小時價格，無承諾	每個模型單元每小時定價，1 個月承諾	每個模型單元每小時定價，6 個月承諾
Claude Instant	44.00 USD	39.60 USD	22.00 USD
Claude 2.0/2.1	70.00 USD	63.00 USD	35.00 USD

區域：亞太區域 (東京)

Anthropic 模型	每個模型單元每小時定價，1 個月承諾	每個模型單元每小時定價，6 個月承諾
Claude Instant	53.00 USD	29.00 USD
Claude 2.0/2.1	86.00 USD	48.00 USD

區域：歐洲 (法蘭克福)

Anthropic 模型	每個模型單元每小時定價，1 個月承諾	每個模型單元每小時定價，6 個月承諾
Claude Instant	49.00 USD	27.00 USD
Claude 2.0/2.1	79.00 USD	44.00 USD

請聯絡您的 AWS 客戶團隊，以取得有關模型單元的更多詳細資訊。

Cohere

Cohere

隨需定價

Cohere 模型	每 1,000 個查詢的定價**
Rerank 3.5	2.00 USD
**您需要根據查詢個數付費，且一個查詢最多可以包含 100 個文件區塊。如果一次查詢包含超過 100 個文件區塊，則算作多個查詢。例如，如果一個請求包含 350 個文件，則它將被視為 4 個查詢。請注意，每個文件最多只能包含 500 個字符 (查詢和文件的總字符數)，如果字符長度高於 512 個字符，則會分解為多個文件。

自訂定價 (微調)

*訓練的字符總數 = 訓練資料語料庫中的字符數量 x 時期數

佈建輸送量定價

Cohere 模型	每個模型每小時價格，無承諾	每個模型單元每小時定價，1 個月承諾	每個模型單元每小時定價，6 個月承諾
Cohere Command	49.50 USD	39.60 USD	23.77 USD
Cohere Command – Light	8.56 USD	6.85 USD	4.11 USD
Embed 3 (英文)	7.12 USD	6.76 USD	6.41 USD
Embed 3 (多語言)	7.12 USD	6.76 USD	6.41 USD

請聯絡您的 AWS 客戶或銷售團隊，以取得有關模型單元的更多詳細資訊。

DeepSeek
DeepSeek

隨需定價
Google

Google

隨需定價

區域：美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 及美國西部 (奧勒岡)

Google 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Gemma 3 4B	0.00004 USD	0.00008 USD
Gemma 3 12B	0.00009 USD	0.00029 USD
Gemma 3 27B	0.00023 USD	0.00038 USD

區域：亞太地區 (孟買)、歐洲 (愛爾蘭) 及歐洲 (米蘭)

Google 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Gemma 3 4B	0.00005 USD	0.00009 USD
Gemma 3 12B	0.00011 USD	0.00034 USD
Gemma 3 27B	0.00027 USD	0.00045 USD

區域：南美洲 (聖保羅) 及亞太地區 (東京)

Google 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Gemma 3 4B	0.00005 USD	0.00010 USD
Gemma 3 12B	0.00011 USD	0.00035 USD
Gemma 3 27B	0.00028 USD	0.00046 USD

區域：歐洲 (倫敦)

Google 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Gemma 3 4B	0.00006 USD	0.00012 USD
Gemma 3 12B	0.00014 USD	0.00045 USD
Gemma 3 27B	0.00036 USD	0.00059 USD

* Priority 方案的定價比標準方案的定價高 75%
* Flex 方案的定價為標準方案定價的 50% 折扣

Kimi AI

Kimi AI

隨需定價

區域：美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 及美國西部 (奧勒岡)

Kimi 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Kimi K2 Thinking	0.00060 USD	0.00250 USD

區域：亞太地區 (孟買)

Kimi 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Kimi K2 Thinking	0.00071 USD	0.00294 USD

區域：南美洲 (聖保羅) 及亞太地區 (東京)

Kimi 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Kimi K2 Thinking	0.00073 USD	0.00303 USD

* Priority 方案的定價比標準方案的定價高 75%
* Flex 方案的定價為標準方案定價的 50% 折扣

Luma AI
隨需定價
中繼

中繼

Llama 4

隨需和批次定價

Llama 3.3

隨需和批次定價

Llama 3.2

隨需和批次定價

模型自訂定價 (微調)

佈建輸送量定價

Llama 3.1

隨需和批次定價

模型自訂定價 (微調)

佈建輸送量定價

Llama 3

隨需定價

Llama 2

隨需定價

區域：美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

Meta 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Llama 2 Chat (130 億)	0.00075 USD	0.001 USD
Llama 2 Chat (700 億)	0.00195 USD	0.00256 USD

模型自訂定價 (微調)

Meta 模型	訓練 1,000 個字符的定價	*每月儲存每個自訂模型的定價**	根據自訂模型每小時 1 個模型單元推斷的定價 (無承諾佈建輸送量定價)
Llama 2 預先訓練 (130 億)	0.00149 USD	1.95 USD	23.50 USD
Llama 2 預先訓練 (700 億)	0.00799 USD	1.95 USD	23.50 USD

*自訂模型儲存 = 1.95 USD

佈建輸送量定價

Meta 模型	每個模型單元每小時定價，1 個月承諾	每個模型單元每小時定價，6 個月承諾
Llama 2 預先訓練及 Chat (130 億)	21.18 USD	13.08 USD
Llama 2 預先訓練 (700 億)	21.18 USD	13.08 USD

*Llama 2 預先訓練模型僅在自訂後的佈建輸送量中可用。

請聯絡您的 AWS 客戶或銷售團隊，以取得有關模型單元的更多詳細資訊。

MiniMax AI

MiniMax AI

隨需定價

區域：美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 及美國西部 (奧勒岡)

Minimax 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Minimax M2	0.00030 USD	0.00120 USD

區域：亞太地區 (孟買)、歐洲 (愛爾蘭) 及歐洲 (米蘭)

Minimax 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Minimax M2	0.00035 USD	0.00141 USD

區域：南美洲 (聖保羅) 及亞太地區 (東京)

Minimax 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Minimax M2	0.00036 USD	0.00145 USD

區域：歐洲 (倫敦)

Minimax 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Minimax M2	0.00047 USD	0.00186 USD

* Priority 方案的定價比標準方案的定價高 75%
* Flex 方案的定價為標準方案定價的 50% 折扣

Mistral AI

Mistral AI

隨需定價

區域：美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 及美國西部 (奧勒岡)

Mistral 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Magistral Small 1.2	0.00050 USD	0.00150 USD
Voxtral Mini 1.0	0.00004 USD	0.00004 USD
Voxtral Small 1.0	0.00010 USD	0.00030 USD
Ministral 3B 3.0	0.00010 USD	0.00010 USD
Ministral 8B 3.0	0.00015 USD	0.00015 USD
Ministral 14B 3.0	0.00020 USD	0.00020 USD
Mistral Large 3	0.00050 USD	0.00150 USD

區域：亞太地區 (孟買)

Mistral 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Magistral Small 1.2	0.00059 USD	0.00176 USD
Voxtral Mini 1.0	0.00005 USD	0.00005 USD
Voxtral Small 1.0	0.00012 USD	0.00035 USD
Ministral 3B 3.0	0.00012 USD	0.00012 USD
Ministral 8B 3.0	0.00018 USD	0.00018 USD
Ministral 14B 3.0	0.00024 USD	0.00024 USD
Mistral Large 3	0.00059 USD	0.00176 USD

區域：南美洲 (聖保羅) 及亞太地區 (東京)

Mistral 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Magistral Small 1.2	0.00061 USD	0.00182 USD
Voxtral Mini 1.0	0.00005 USD	0.00005 USD
Voxtral Small 1.0	0.00012 USD	0.00036 USD
Ministral 3B 3.0	0.00012 USD	0.00012 USD
Ministral 8B 3.0	0.00018 USD	0.00018 USD
Ministral 14B 3.0	0.00024 USD	0.00024 USD
Mistral Large 3	0.00061 USD	0.00182 USD

區域：歐洲 (愛爾蘭) 及歐洲 (米蘭)

Mistral 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Magistral Small 1.2	0.00059 USD	0.00176 USD
Voxtral Mini 1.0	0.00005 USD	0.00005 USD
Voxtral Small 1.0	0.00012 USD	0.00035 USD
Ministral 3B 3.0	0.00012 USD	0.00012 USD
Ministral 8B 3.0	0.00018 USD	0.00018 USD
Ministral 14B 3.0	0.00024 USD	0.00024 USD

區域：歐洲 (倫敦)

Mistral 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Magistral Small 1.2	0.00078 USD	0.00233 USD
Voxtral Mini 1.0	0.00006 USD	0.00006 USD
Voxtral Small 1.0	0.00016 USD	0.00047 USD
Ministral 3B 3.0	0.00016 USD	0.00016 USD
Ministral 8B 3.0	0.00023 USD	0.00023 USD
Ministral 14B 3.0	0.00031 USD	0.00031 USD

* Priority 方案的定價比標準方案的定價高 75%
* Flex 方案的定價為標準方案定價的 50% 折扣

NVIDIA

NVIDIA

隨需定價

區域：美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 及美國西部 (奧勒岡)

NVIDIA 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
NVIDIA Nemotron Nano 2	0.00006 USD	0.00023 USD
NVIDIA Nemotron Nano 2 VL	0.00020 USD	0.00060 USD

區域：亞太地區 (孟買)、歐洲 (愛爾蘭) 及歐洲 (米蘭)

NVIDIA 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
NVIDIA Nemotron Nano 2	0.00007 USD	0.00027 USD
NVIDIA Nemotron Nano 2 VL	0.00024 USD	0.00071 USD

區域：南美洲 (聖保羅) 及亞太地區 (東京)

NVIDIA 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
NVIDIA Nemotron Nano 2	0.00007 USD	0.00028 USD
NVIDIA Nemotron Nano 2 VL	0.00024 USD	0.00073 USD

區域：歐洲 (倫敦)

NVIDIA 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
NVIDIA Nemotron Nano 2	0.00009 USD	0.00036 USD
NVIDIA Nemotron Nano 2 VL	0.00031 USD	0.00093 USD

* Priority 方案的定價比標準方案的定價高 75%
* Flex 方案的定價為標準方案定價的 50% 折扣

OpenAI

OpenAI

隨需定價

區域：美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 及美國西部 (奧勒岡)

OpenAI 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
GPT OSS Safeguard 20B	0.00007 USD	0.00020 USD
GPT OSS Safeguard 120B	0.00015 USD	0.00060 USD

區域：亞太地區 (孟買)、南美洲 (聖保羅) 及亞太地區 (東京)

OpenAI 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
GPT OSS Safeguard 20B	0.00008 USD	0.00024 USD
GPT OSS Safeguard 120B	0.00018 USD	0.00071 USD

區域：歐洲 (愛爾蘭) 及歐洲 (米蘭)

OpenAI 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
GPT OSS Safeguard 20B	0.00008 USD	0.00023 USD
GPT OSS Safeguard 120B	0.00018 USD	0.00070 USD

區域：歐洲 (倫敦)

OpenAI 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
GPT OSS Safeguard 20B	0.00011 USD	0.00031 USD
GPT OSS Safeguard 120B	0.00023 USD	0.00093 USD

* Priority 方案的定價比標準方案的定價高 75%
* Flex 方案的定價為標準方案定價的 50% 折扣

TwelveLabs
TwelveLabs

隨需定價
Stability AI

Stability AI

隨需定價

Stability AI 提供的上一代影像模型依影像定價，具體取決於步驟數和影像解析度。

區域：奧勒岡州、北維吉尼亞州、俄亥俄州

Stability AI 影像服務	每個模型的生成費用
Stable Image 移除背景	0.07 USD
Stable Image 消除物件	0.07 USD
Stable Image 控制結構	0.07 USD
Stable Image 控制草圖	0.07 USD
Stable Image 樣式指南	0.07 USD
Stable Image 搜索與替換	0.07 USD
Stable Image 影像修復	0.07 USD
Stable Image 搜索與重新著色	0.07 USD
Stable Image 樣式傳輸	0.08 USD
Stable Image 保守型升頻	0.40 USD
Stable Image 創意型升頻	0.60 USD
Stable Image 快速升頻	0.03 USD
Stable Image 畫布擴繪	0.06 USD

Writer

Writer

隨需定價

Writer 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Palmyra X4	0.0025 USD	0.010 USD
Palmyra X5	0.0006 USD	0.006 USD

Qwen

Amazon Bedrock

Qwen

隨需定價

區域：美國東部 (維吉尼亞北部)、美國東部 (俄亥俄) 及美國西部 (奧勒岡)

Qwen 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Qwen3 Next 80B A3B	0.00015 USD	0.00120 USD
Qwen3 VL 235B A22B	0.00053 USD	0.00266 USD

區域：亞太地區 (孟買)、歐洲 (愛爾蘭) 及歐洲 (米蘭)

Qwen 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Qwen3 Next 80B A3B	0.00018 USD	0.00141 USD
Qwen3 VL 235B A22B	0.00062 USD	0.00313 USD

區域：南美洲 (聖保羅) 及亞太地區 (東京)

Qwen 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Qwen3 Next 80B A3B	0.00018 USD	0.00145 USD
Qwen3 VL 235B A22B	0.00064 USD	0.00322 USD

區域：歐洲 (倫敦)

Qwen 模型	每 1,000 個輸入字符的定價	每 1,000 個輸出字符的定價
Qwen3 Next 80B A3B	0.00023 USD	0.00186 USD
Qwen3 VL 235B A22B	0.00082 USD	0.00412 USD

* Priority 方案的定價比標準方案的定價高 75%
* Flex 方案的定價為標準方案定價的 50% 折扣

自訂模型匯入

自訂模型匯入

Llama

區域：美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

自訂模型單位版本	v1.0
每個自訂模型單元每分鐘的價格*	0.05718 USD
每個自訂模型單元每月儲存成本	1.95 USD

區域：歐洲 (法蘭克福)

自訂模型單元版本	v1.0
每個自訂模型單元每分鐘的價格*	0.07144 USD
每個自訂模型單元每月儲存成本	1.95 USD

注意：託管模型所需的自訂模型單元取決於多種因素，尤其是模型架構、模型參數計數和關聯內容長度。所需自訂模型單元的準確數量將在匯入時確定。做為參考，Llama 3.1 8B 128K 模型需要 2 個自訂模型單元，Llama 3.1 70B 128k 模型需要 8 個自訂模型單元。

*以 5 分鐘時段計費

多模態 Llama

區域：美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

自訂模型單位版本	v1.0
每個自訂模型單元每分鐘的價格*	0.05718 USD
每個自訂模型單元每月儲存成本	1.95 USD

區域：歐洲 (法蘭克福)

自訂模型單元版本	v1.0
每個自訂模型單元每分鐘的價格*	0.07144 USD
每個自訂模型單元每月儲存成本	1.95 USD

*以 5 分鐘時段計費

Mistral

區域：美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

自訂模型單位版本	v1.0
每個自訂模型單元每分鐘的價格*	0.05718 USD
每個自訂模型單元每月儲存成本	1.95 USD

區域：歐洲 (法蘭克福)

自訂模型單元版本	v1.0
每個自訂模型單元每分鐘的價格*	0.07144 USD
每個自訂模型單元每月儲存成本	1.95 USD

*以 5 分鐘時段計費

Mixtral

區域：美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

自訂模型單位版本	v1.0
每個自訂模型單元每分鐘的價格*	0.05718 USD
每個自訂模型單元每月儲存成本	1.95 USD

區域：歐洲 (法蘭克福)

自訂模型單元版本	v1.0
每個自訂模型單元每分鐘的價格*	0.07144 USD
每個自訂模型單元每月儲存成本	1.95 USD

*以 5 分鐘時段計費

Flan

區域：美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

自訂模型單位版本	v1.0
每個自訂模型單元每分鐘的價格*	0.05718 USD
每個自訂模型單元每月儲存成本	1.95 USD

區域：歐洲 (法蘭克福)

自訂模型單元版本	v1.0
每個自訂模型單元每分鐘的價格*	0.07144 USD
每個自訂模型單元每月儲存成本	1.95 USD

*以 5 分鐘時段計費

隨需推論定價：
從第一次成功調用開始，模型副本處於作用中期間，系統會以 5 分鐘時段計費。每個模型副本的最大輸送量和並行限制取決於輸入/輸出權杖組合、硬體類型、模型大小、架構、推論最佳化等因素，並在模型匯入工作流程期間確定。

Bedrock 會視乎您的用量模式自動調整模型副本數目。如果在 5 分鐘期間內沒有調用，Bedrock 會縮減規模至零，並在您調用模型時重新擴展。重新擴展備份時，視乎機型大小，您可能會遇到冷啟動持續時間 (數十秒)。如果您的推論磁碟區持續超過單一模型副本的並行限制，Bedrock 也會擴展模型副本數目。注意：每個帳戶每個匯入模型預設最多可透過 Service Quotas 增加 3 個模型副本。

Qwen

區域：美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

自訂模型單位版本	v1.0
每個自訂模型單元每分鐘的價格*	0.05718 USD
每個自訂模型單元每月儲存成本	1.95 USD

區域：歐洲 (法蘭克福)

自訂模型單元版本	v1.0
每個自訂模型單元每分鐘的價格*	0.07144 USD
每個自訂模型單元每月儲存成本	1.95 USD

*以 5 分鐘時段計費

OpenAI

區域：美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

自訂模型單元版本	版本 2.0
每個自訂模型單元每分鐘的價格*	0.1433 USD
每個自訂模型單元每月儲存成本	1.95 USD

*以 5 分鐘時段計費

工具和最佳化定價詳細資訊

流程

Amazon Bedrock Flows

依據執行應用程式所需的節點轉換次數計費。每次在工作流程中執行節點時，Bedrock Flows 會對節點轉換計數。依據所有流程中的節點轉換總數來支付費用。

自 2025 年 2 月 1 日起，所有費用按天及按月計費。

每 1,000 次節點轉換的價格
0.035 USD

其他費用

如果應用程式工作流程執行時會利用其他 AWS 服務或傳輸資料，可能會產生其他費用。例如，如果您的工作流程調用 Amazon Bedrock 防護機制政策，則會針對政策處理的文字單元數目計費。

知識庫
結構化資料擷取 (SQL 生成)

結構化資料擷取對產生 SQL 查詢的每個請求收費。產生的 SQL 查詢用於從結構化資料存放區中擷取資料。

重新排序模型

重新排序模型旨在提高檢索增強生成 (RAG) 應用程式中回應的相關性和準確性。這些模型按查詢數量收費。

**您需要根據查詢個數付費，且一個查詢最多可以包含 100 個文件區塊。如果一次查詢包含超過 100 個文件區塊，則算作多個查詢。例如，如果一個請求包含 350 個文件，則它將被視為 4 個查詢。請注意，每個文件最多只能包含 512 個字符 (查詢和文件的總字符數)，如果字符長度高於 512 個字符，則會分解為多個文件。一個查詢相當於一個搜尋單位。
防護機制

Amazon Bedrock 防護機制

Amazon Bedrock 防護機制的定價取決於防護機制中使用篩選條件所產生的費用。標準方案和經典方案的定價相同。

防護機制篩選條件*	定價
標準方案和經典方案 (文字內容) 的內容篩選條件	每 1,000 個文字單元 0.15 USD
內容篩選條件 (影像內容)	每處理一個影像 0.00075 USD
標準方案和經典方案的拒絕主題	每 1,000 個文字單元 0.15 USD
敏感資訊篩選條件	每 1,000 個文字單元 0.10 USD
敏感資訊篩選條件 (正規表達式)	免費
文字過濾器	免費
情境依據檢查	每 1,000 個文字單元 0.10 USD
自動推理檢查	根據自動推理政策，每 1,000 個文字單元 0.17 USD

隨需定價

* 每個防護機制篩選條件皆為選用，可以根據您的應用程式需求啟用。將根據防護機制中使用的篩選條件類型計費。例如，如果設定了內容篩選條件和拒絕主題防護機制，則僅會收取這兩個篩選條件的費用，而不會收取與敏感資訊篩選條件關聯的費用。

注意：一個文字單元最多可包含 1000 個字元。如果文字輸入超過 1000 個字元，則會視為多個文字單元處理，每個單元將包含至多 1000 個字元。例如，如果文字輸入包含 5600 個字元，則將收取 6 個文字單元的費用。

情境依據檢查使用參考來源和查詢，來判斷模型回應是否以來源為依據並且與查詢相關。計費的文字單元總數依據來源、查詢和模型回應相結合的所有字元來計算。

模型評估

模型評估

透過您選擇的模型進行推論需要收取模型評估費用。自動生成的演算法分數為免費提供。對於您自帶工作團隊的人工評估，您需要支付評估中的模型推論費用，以及每完成一項人工任務 0.21 USD 的費用。

型號

每 1,000 個輸入字符的定價

每 1,000 個輸出字符的定價

每項人工任務的價格

選擇用於評估的模型

根據選擇的模型

0.21 USD

資料自動化
資料自動化

Amazon Bedrock 知識庫提供了 Bedrock 資料自動化整合，可為多模態資料提供更相關、更準確的回應。設定知識庫時，您可以選取 Bedrock 資料自動化作為解析方法，從影像或文件 (可以是圖形、表格和圖表) 中分析和擷取有意義的資訊。在處理過程中，Bedrock 資料自動化從擷取的文件和影像中擷取有意義的資訊，然後在後續知識庫步驟中用於分塊、嵌入和儲存。當與知識庫整合時，Bedrock 資料自動化提供標準化輸出並收費。
智慧提示路由

價格點	定價維度	定價計畫
智慧提示路由	每 1,000 個請求 1 USD	隨需

智慧提示路由

智慧提示路由可讓您使用同一模型系列的基礎模型 (FM) 組合，以協助最佳化品質和成本。例如，使用 Anthropic 的 Claude 模型系列，Amazon Bedrock 可根據提示的複雜度，智慧地在 Claude 3.5 Sonnet 與 Claude 3 Haiku 之間路由請求。同樣地，Amazon Bedrock 可在 Meta Llama 3.3 70B 和 3.18B 之間，以及 Nova Pro 和 Nova Lite 之間路由請求。提示路由器會預測哪種模型將為每個請求提供最佳效能，同時協助最佳化回應品質和成本。這對於客戶服務助理等應用程式尤其有用，這可透過更小、更快捷和更經濟高效的模型來處理簡單的查詢，而複雜的查詢則會路由至更具能力的模型。智慧提示路由可以在不影響精確性的情況下降低高達 30% 的成本。

提示最佳化

針對 Amazon Bedrock 的提示最佳化

根據輸入提示和最佳化提示中的字符數計費。

所有費用將從 2025 年 4 月 23 日起每月計費。

每 1,000 個字符的價格

0.030 USD

定價範例

AI21 Labs

應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫：要求 AI21 的 Jurassic-2 Mid 模型將輸入文字的 10,000 個字符輸入結果，總結為 2000 個字符的輸出結果。

產生的總成本 = 10,000 個字符/1,000 * 0.0125 USD + 2,000 個字符/1,000 * 0.0125 USD = 0.15 USD
Amazon

隨需定價

應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫：要求 Amazon Titan Text Lite 模型將輸入文字的 2000 個字符輸入結果，總結為 1000 個字符的輸出結果。

每小時產生的總成本 = 2000 個字符/1000 * 0.0003 USD + 1000 個字符/1000 * 0.0004 USD = 0.001 USD。

應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫：要求 Amazon Titan 影像產生器模型產生 1000 個 1024 x 1024 大小的標準品質映像。

產生的總成本 = 1000 個映像 * 每個映像 0.01 USD = 10 USD

自訂 (微調和持續預先訓練) 定價

應用程式開發人員使用 1000 個影像/文字配對自訂 Amazon Titan 影像產生模型。訓練後，開發人員會使用自訂模型佈建輸送量 1 小時來評估模型的效能。微調的模型會儲存 1 個月。評估後，開發人員會使用佈建輸送量 (1 個月使用期) 來託管自訂模型。

每月微調成本為：微調訓練 (0.005 * 500 * 64 USD)，其中 0.005 USD 是每張看到之影像的定價，500 是步驟數，64 是批次大小 + 每月自訂模型儲存 (1.95 USD) + 1 小時自訂模型推論 (21 USD) = 160 + 1.95 + 21 USD = 182.95 USD

佈建輸送量定價

應用程式開發人員購買兩個 Amazon Titan Text Express 模型單元，且其文字摘要使用案例的期限為 1 個月。

每月產生的總成本 = 2 個模型單元 * 18.40 USD/小時 * 24 小時 * 31 天 = 27,379.20 USD

應用程式開發人員購買一個基礎 Amazon Titan 影像產生器模型的模型單元，且使用期限為 1 個月。

產生的總成本 = 1 個模型單元 * 16.20 USD * 24 小時 * 31 天 = 12,052.80 USD
Amazon Bedrock 防護機制
範例 1：客戶支援聊天機器人
一名應用程式開發人員建立了一個客戶支援聊天機器人，並使用內容過濾器封鎖有害內容和拒絕主題，以過濾不想要的查詢和回應。

聊天機器人每小時提供 1000 個用戶查詢。每個使用者查詢的平均輸入長度為 200 個字元，並接收 1500 個字元的 FM 回應。

每個 200 個字元的使用者查詢對應於 1 個文字單元。

每個 1500 個字元的 FM 回應對應於 2 個文字單元。

每小時處理的文字單元 = (1 + 2) * 1,000 個查詢 = 3,000 個文字單元

內容過濾器和拒絕主題每小時產生的總費用 = 3,000 * (0.15 USD + 0.15 USD) /1,000 = 0.90 USD

範例 2：呼叫中心轉錄摘要
一名應用程式開發人員建立了一個應用程式，以彙總使用者與客服人員之間的聊天記錄。它使用敏感信息過濾器編輯 10,000 個對話的生成摘要中的個人身分識別資訊 (PII)。

每個生成的摘要平均有 3500 個字元，對應於 4 個文字單元。

總結 10,000 次對話所產生的總成本 = 10000 * 4 * (0.1/1000 USD) = 4 USD
範例 3：醫療協議驗證引擎
一家醫療科技公司在其臨床決策支援系統中導入自動推理檢查功能，用於驗證治療建議是否符合醫療準則。

該系統每月處理 5,000 個病患個案。每個個案包含：
- 病患資料摘要：500 個字元 (1 個文字單元)
- 診斷評估：2,000 個字元 (2 個文字單元)
- 治療建議：4,500 個字元 (5 個文字單元)
每月處理的文字單元總數 = (1 + 2 + 5) 5,000 個個案 = 4 萬個文字單位
自動推理檢查每月產生的總成本 = 4 萬 × (0.17 USD) / 1000 = 6.80 USD
Amazon Bedrock 知識庫

定價範例 1 (使用 Amazon Rerank 1.0 模型重新排序)

在給定月份內，您使用 Amazon Rerank 1.0 模型向 Rerank API 發出 200 萬個請求；其中 100 萬個請求中每個請求包含的文件少於 100 個，因此每個請求將按 1 個請求收費；其餘 100 萬個請求中每個請求包含 120-150 個文件，因此每個請求將按 2 個請求收費。

1 個請求的定價 = 0.001 USD
總費用 = 1,000,000 * 0.001 USD + 1,000,000 * 2 * 0.001 USD = 3,000 USD

定價範例 2：(結構化資料擷取)

應用程式開發人員建立了一個支援聊天機器人，需查詢儲存在 Amazon Redshift 中的結構化資料。該開發人員建立了 Bedrock 知識庫並將其連線至 Amazon Redshift。該聊天機器人每小時能夠接受 10,000 個用戶查詢。GenerateQuery API 從使用者查詢產生 SQL，每個使用者查詢的費用為 0.002 USD。

每小時產生 SQL 所需總費用 = 0.002 USD * 10,000 = 20 USD。
當月總成本 = 20 USD * 24 * 30 = 1440 USD
Anthropic

隨需定價

應用程式開發人員針對美國西部 (奧勒岡) 地區的 Amazon Bedrock 發出下列 API 呼叫：要求 Anthropic 的 Claude 模型將輸入文字的 11,000 個字符輸入結果，總結為 4000 個字符的輸出結果。

產生的總成本 = 11,000 個字符/1000 * 0.008 USD + 4000 個字符/1000 * 0.024 USD = 0.088 USD + 0.096 USD = 0.184 USD

佈建輸送量定價

應用程式開發人員在美國西部 (奧勒岡) 地區購買一個 Anthropic Claude Instant 的模型單元：

每月產生的總成本 = 1 個模型單元 * 39.60 USD * 24 小時 * 31 天 = 29,462.40 USD
Cohere

隨需定價

應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫：要求 Cohere 的 Command 模型將輸入文字的 6000 個字符輸入結果，總結為 2000 個字符的輸出結果。

產生的總成本 = 6000 個字符/1,000 * 0.0015 USD + 2000 個字符/1,000 * 0.0020 USD = 0.013 USD

應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫：要求 Cohere 的 Command - Light 模型將輸入文字的 6000 個字符輸入結果，總結為 2000 個字符的輸出結果。

產生的總成本 = 6000 個字符/1000 * 0.0003 USD + 2000 個字符/1000 * 0.0006 USD = 0.003 USD

應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫：要求 Cohere 的 Embed English 或 Embed Multilingual 模型產生 10,000 個字符輸入結果的嵌入。

產生的總成本 = 10,000 個字符/1000 * 0.0001 USD = 0.001 USD

自訂 (微調) 定價

應用程式開發人員使用 1000 個資料字符自訂 Cohere Command 模型。訓練後，使用自訂模型佈建輸送量 1 小時來評估模型的效能。微調的模型會儲存 1 個月。評估後，開發人員會使用佈建輸送量 (1 個月使用期) 來託管自訂模型。

微調每月產生的成本為：微調訓練 (0.004 USD * 1000) + 每月自訂模型儲存 (1.95 USD) + 1 小時自訂模型推論 (49.50 USD) = 55.45 USD

自訂模型的佈建輸送量 (1 個月使用期) 產生的每月成本 = 39.60 USD

佈建輸送量定價

應用程式開發人員購買一個 Cohere Command 模型單元，且其文字摘要使用案例的期限為 1 個月。

每月產生的總成本 = 1 個模型單元 * 39.60 USD * 24 小時 * 31 天 = 29,462.40 USD
自訂模型匯入

定價範例：應用程式開發人員匯入自訂的 Llama 3.1 類型模型，大小採用 8B 參數，在 us-east-1 區域的序列長度為 128K 並在 1 個月之後刪除模型。這需要 2 個自訂模型單元。因此，每分鐘價格將為 0.1570 USD，因為需要 2 個自訂模型單元。2 個自訂模型單元的模型儲存成本為每月 3.90 USD。

匯入模型無需費用。第一次成功調用為上午 8:03，此時計量開始。5 分鐘計量時段為上午 8:03 至上午 8:07；上午 8:07 至上午 8:11 等。如果在任何 5 分鐘期間至少有一次調用，該時段將視為作用中進行計費。如果在上午 8:03 調用，而在上午 8:07 後沒有進一步調用，則計量將於上午 8:07 停止。在這種情況下，如下所示計費：0.1570 USD * 5 分鐘 * 1 個五分鐘時段 = 0.785 USD。
資料自動化

定價範例 1：
假設您使用 BDA 自訂輸出處理一個 1,000 頁的文件。這 1,000 頁均使用具有 15 個欄位的藍圖 1 進行處理。任何包含不超過 30 個欄位的藍圖的每頁定價為 0.040 USD。總費用為 40 USD。

處理的總頁數 = 1,000
欄位少於 30 個的藍圖每頁定價 = 0.040 USD
總費用 = 1,000 * 0.040 USD = 40 USD

定價範例 2：
假設您使用 BDA 自訂輸出處理 2 個文件。文件 1 有 40 頁，使用具有 20 個欄位的藍圖 1 進行處理。文件 2 有 10 頁，使用具有 40 個欄位的藍圖 2 進行處理。藍圖 1 的每頁定價為 0.040 USD，因為它包含的欄位不超過 30 個。藍圖 2 的每頁定價為 0.045 USD。使用藍圖 1 處理的文件 1 的處理費用為 1.60 USD。使用藍圖 2 處理的文件 2 的處理費用為 0.45 USD。處理這兩份文件的總費用為 2.05 USD。

處理的總頁數 = 50
欄位少於 30 個的藍圖 1 每頁定價 = 0.040 USD
具有 40 個欄位的藍圖 2 每頁定價 = 0.040 USD + (超過 30 個的欄位數 * 每個欄位 0.0005 USD)
超過 30 個的欄位數 = 40 - 30 = 10
具有 40 個欄位的藍圖 2 每頁定價 = 0.040 USD + (10 *每個欄位 0.0005 USD) = 0.045 USD
使用藍圖 1 處理的文件 1 的處理費用 = 40 頁 x 每頁 0.040 USD = 1.6 USD
使用藍圖 2 處理的文件 2 的處理費用 = 10 頁 x 每頁 0.045 USD = 0.45 USD
總費用 = 檔案 1 的費用 + 檔案 2 的費用 = 1.6 USD + 0.45 USD = 2.05 USD

定價範例 3︰
假設您設定 Bedrock 知識庫以使用 Bedrock 資料自動化作為解析器，然後擷取一個 1,000 頁的文件。請注意，「知識庫」剖析選項之間的成本結構有所差異。BDA 使用每頁定價，而基礎模型解析器則依據輸入和輸出字符計費。對於內容，處理 1,000 頁 (其中 30% 包含表格，30% 包含數字) 通常需要 2,900 個輸入字符和 750 個輸出字符。字符取用因內容類型而異，因此鼓勵客戶使用自己的資料進行測試，以獲得更準確的估算。Bedrock 知識庫和 Bedrock 資料自動化整合使用標準輸出，每頁價格為 0.010 USD。總費用為 10 USD。

處理的總頁數 = 1,000
標準輸出每頁定價 = 0.010 USD
總費用 = 1,000 * 0.010 USD = 10 USD

定價範例 4：
假設您使用 BDA 標準輸出處理 60 分鐘的影片。影片標準輸出每分鐘的定價為 0.050 USD。總費用為 3.00 USD。

處理總分鐘數 = 60
影片標準輸出每分鐘的定價 = 0.050 USD
總費用 = 60 * 0.050 USD = 3.00 USD

定價範例 5：
假設您使用 BDA 自訂輸出處理 2,000 張影像。前 1,000 張影像使用藍圖 1 進行處理，該藍圖有 10 個欄位。後 1,000 張使用藍圖 2 進行處理，該藍圖有 40 個欄位。藍圖 1 處理每張影像的定價為 0.005 USD，因為它包含的欄位不超過 30 個。藍圖 2 處理每張影像的定價為 0.01 USD。使用藍圖 1 處理前 1,000 張影像的處理費用為 5.00 USD。使用藍圖 2 處理後 1,000 張影像的處理費用為 10.00 USD。處理全部 2,000 張影像的總費用為 15.00 USD

前 1000 張影像的費用 = 1,000 張影像 * 每張影像 0.005 USD = 5.00 USD
後 1,000 張影像的費用 = 1,000 張影像 * (0.005 USD + (超過 30 個的欄位數 * 每個欄位 0.0005 USD))
= 1,000 * (0.005 USD + ((40-30) * 0.0005 USD))
= 1,000 * (0.005 USD + (10 * 0.0005 USD)) = 10.00 USD
總費用 = 5.00 USD + 10.00 USD = 15.00 USD

定價範例 6：
假設您想要使用 Bedrock 資料自動化標準輸出來處理貴組織 15,000 分鐘的會議錄音。處理這 15,000 分鐘音訊的總費用為 90 USD。

處理的總分鐘數 = 15,000 分鐘
總費用 = 15,000 分鐘 × 0.006 USD = 90 USD
DeepSeek

隨需定價

應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫：請求 DeepSeek-R1 模型將輸入文字的 2,000 個字符輸入結果，總結為 1,000 個字符的輸出結果 (包括推理字符)：

每小時產生的總成本 = 2,000 個字符/1,000 * 0.00135 USD + 1,000 個字符/1,000 * 0.0054 USD = 0.0081 USD
流程

範例：新聞摘要
應用程式開發人員建立一項流程，為交易者自動化新聞摘要。該流程涉及一個接收 S3 位置的輸入節點和一個 S3 擷取節點，後者從 S3 中擷取 10 個檔案，其中包含 10 個主要新聞機構的文章 (2 次節點轉換)。然後，它使用疊代器節點調用帶有提示節點的模型來彙總每個檔案 (+ 10 個檔案 x 2 次節點轉換)。然後使用收集器節點來收集所有結果，使用 S3 存儲節點將結果寫入 S3，然後在輸出節點中完成 (+ 3 次節點轉換)。每週每半個小時執行一次此流程。

每個流程執行的節點轉換次數為：2 + 1 + 10 * 2 + 3 = 25 次節點轉換/流程執行

每月流程執行次數為：24 小時 * 2* 5 天 * 4 週 = 960 次流程執行/月。

每月帳單總額為：25 * 960 * 0.035 USD/1,000 = 0.84 USD

其他費用
該帳單還包括在工作流程執行中使用的 AWS 服務的額外費用，包括在擷取和儲存節點中的 Amazon S3 用量，以及提示節點中的 Amazon Bedrock 基礎模型用量。
中繼

隨需定價

應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫：要求 Meta 的 Llama 2 Chat (130 億) 模型將輸入文字的 2000 個字符輸入結果，總結為 500 個字符的輸出結果。

產生的總成本 = 2000 個字符/1000 * 0.00075 USD + 500 個字符/1000 * 0.001 USD = 0.002 USD

自訂 (微調) 定價

應用程式開發人員使用 1000 個資料字符自訂 Llama 2 預先訓練 (700 億) 模型。訓練後，使用自訂模型佈建輸送量 1 小時來評估模型的效能。微調的模型會儲存 1 個月。評估後，開發人員會使用佈建輸送量 (1 個月使用期) 來託管自訂模型。

微調每月產生的成本為：微調訓練 (0.00799 USD * 1000) + 每月自訂模型儲存 (1.95 USD) + 1 小時自訂模型推論 (23.50 USD) = 33.44 USD

自訂模型的佈建輸送量 (1 個月使用期) 產生的每月成本 = 21.18 USD

佈建輸送量定價

應用程式開發人員購買一個 Meta Llama 2 模型單元，且其文字摘要使用案例的期限為 1 個月。

每月產生的總成本為 1 個模型單元 * 21.18 USD * 24 小時 * 31 天 = 15,757.92 USD
Mistral AI

隨需定價

應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫：要求 Mistral 7B 模型將輸入文字的 2000 個字符輸入結果，總結為 1000 個字符的輸出結果。

每小時產生的總成本 = 2000 個字符/1000 * 0.00015 USD + 1000 個字符/1000 * 0.0002 USD = 0.0005 USD

應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫：要求 Mixtral 8x7B 模型將輸入文字的 2000 個字符輸入結果，總結為 1000 個字符的輸出結果。

每小時產生的總成本 = 2000 個字符/1000 * 0.00045 USD + 1000 個字符/1000 * 0.0007 USD = 0.0016 USD

應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫：要求 Mistral 大型模型將輸入文字的 2000 個字符輸入結果，總結為 1000 個字符的輸出結果。

每小時產生的總成本 = 2,000 個字符/1,000 * 0.008 USD + 1,000 個字符/1,000 * 0.024 USD = 0.04 USD

模型評估

模型評估範例 1︰

隨需定價
應用程式開發人員在美國東部 (維吉尼亞北部) AWS 區域使用 Anthropic Claude 2.1 和 Anthropic Claude Instant，提交資料集進行人工模型評估。

資料集包含 50 個提示，開發人員需要 1 名工作者對每個提示回應集進行評分 (可在建立評估任務時設定為「每個提示的工作者」參數)。

此評估任務中將有 50 項任務 (每位工作者每個提示回應組為 1 項任務)。50 個提示共計為 5000 個輸入字符，相關的回應共計 15000 個字符 (使用 Anthropic Claude Instant) 和 20000 個字符 (使用 Anthropic Claude 2.1)。

此模型評估任務會產生下列費用：

項目	輸入字符數	每 1,000 個輸入字符的定價	輸入成本	輸出字符數	每 1,000 個輸出字符的定價	輸出成本	人工任務數目	每項人工任務的價格	人工任務的成本	總計
Claude Instant Inference	5000	0.0008 USD	0.004 USD	15,000	0.0024 USD	0.036 USD				0.04 USD
Claude 2.1 Inference	5000	0.008 USD	0.04 USD	20,000	0.024 USD	0.48 USD				0.52 USD
人工任務							50	0.21 USD	10.50 USD	10.50 USD
總計										11.06 USD

模型評估範例 2︰

隨需定價
應用程式開發人員在美國東部 (維吉尼亞北部) AWS 區域使用 Anthropic Claude 2.1 和 Anthropic Claude Instant，提交資料集進行人工模型評估。

資料集包含 50 個提示，開發人員需要 2 名工作者對每個提示回應集進行評分 (可在建立評估任務時設定為「每個提示的工作者」參數)。此評估任務中將有 100 項任務 (每位工作者每個提示回應組為 1 項任務：2 個工作者 x 50 個快速回應集 = 100 個人工任務)。

50 個提示共計為 5000 個輸入字符，相關的回應共計 15000 個字符 (使用 Anthropic Claude Instant) 和 20000 個字符 (使用 Anthropic Claude 2.1)。

此模型評估任務會產生下列費用：

項目	輸入字符數	每 1,000 個輸入字符的定價	輸入成本	輸出字符數	每 1,000 個輸出字符的定價	輸出成本	人工任務數目	每項人工任務的價格	人工任務的成本	總計
Claude Instant Inference	5000	0.0008 USD	0.0040 USD	15000	0.0024 USD	0.036 USD				0.04 USD
Claude 2.1 Inference	5000	0.008 USD	0.0400 USD	20,000	0.024 USD	0.48 USD				0.52 USD
人工任務							100	0.21 USD	21.00 USD	21.00 USD
總計										21.56 USD

提示最佳化

範例：新聞摘要
應用程式開發人員使用 Claude 3.5 建立提示來為交易者總結新聞。原始提示包括 429 個字符。最佳化的提示具有 511 個字符，並包括更具體的說明和範例，以從 FM 產生更簡潔的答案。他使用具有 511 個字符的最佳化提示作為提示最佳化工具的輸入，並為 Claude 3.7 和 Nova Pro 建立了 2 個新變體 (分別具有 582 個和 579 個字符)。

提示最佳化的輸入和輸出字符總數：429 + 511 + 511 + 582 + 511 + 579 = 3,123

每月帳單總額為：3,123 / 1,000 * 0.03 USD = 0.09 USD
Stability AI

隨需定價

應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫：要求 SDXL 模型產生 512 x 512 大小、步長為 70 的映像 (高品質)。

產生的總成本 = 1 個映像 * 每個映像 0.036 USD = 0.036 USD

應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫：要求 SDXL 1.0 模型產生 1024 x 1024 大小、步長為 70 的映像 (高品質)。

產生的總成本 = 1 個映像 * 每個映像 0.08 USD = 0.08 USD

佈建輸送量定價

應用程式開發人員購買一個 SDXL 1.0 模型單元，且使用期為 1 個月。

產生的總成本 = 1 * 49.86 USD * 24 小時 * 31 天 = 37,095.84 USD
TwelveLabs

隨需定價

應用程式開發人員向 Amazon Bedrock 做出下列 API 呼叫：對 Pegasus 1.2 模型提出請求，以描述時長為 10 秒的影片需要的內容，這會提供 2,000 個字符輸出。

產生的成本總計 = 10 秒 * 0.00049 USD + 2,000 個字符/1000 * 0.0075 USD = 0.0199 USD

應用程式開發人員會向 Amazon Bedrock 做出下列 API 呼叫：對 Marengo Embed [3.0 或 2.7] 模型提出請求，以嵌入 10 段影片，總持續時間為 100 分鐘。

產生的成本總計 = 100 分鐘 (即 6000 秒) * 0.00070 USD = 4.2 USD

應用程式開發人員會向 Amazon Bedrock 做出下列 API 呼叫：對 Marengo Embed 3.0 模型提出請求，透過同時提供文字和影像產生嵌入，開發人員可以使用該嵌入，在本已使用上述範例裝箱的嵌入儲存庫中尋找在給定影像中顯示之包袋的剪輯片段。

產生的成本總計 = 1 個文字請求 * 0.00007 USD + 1 個影像請求 * 0.0001 USD = 0.00017 USD

應用程式開發人員會向 Amazon Bedrock 做出下列 API 呼叫：對 Marengo Embed [3.0 或 2.7] 模型提出請求，透過提供文字產生嵌入，開發人員可以使用該嵌入，從本已使用上述範例裝箱的嵌入儲存庫中尋找相符的剪輯片段。

產生的成本總計 = 1 個文字請求 * 0.00007 USD = 0.00007 USD
Writer

應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫：請求 Writer 的 Palmyra X5 模型將輸入文字的 10,000 個字符輸入結果，總結為 2,000 個字符的輸出結果。

產生的總成本 = 1 萬個字符/1,000 * 0.003 USD + 2,000 個字符/1,000 * 0.015 USD = 0.06 USD

後續步驟

研討會

透過引導式工作坊來探索常見 Amazon Bedrock 使用案例

檢視工作坊

示範

查看 Amazon Bedrock 功能的示範

探索示範資料庫

Amazon Bedrock 定價

定價概觀

服務方案和模型匯入

標準方案

Priority 方案

Flex 方案

批次

自訂模型匯入

自訂與最佳化

模型自訂

提示快取

提示管理和最佳化

工具

防護機制

知識庫

Amazon Bedrock Data Automation

流程

評估

模型定價詳細資訊

AI21 Labs

Amazon Nova

理解模型的定價

全球跨區域推論

地理跨區域推論與區域內

內建工具

創意內容生成模型的定價

語音理解和生成模型的定價

語音轉換語音基礎模型的隨需定價

嵌入模型的定價

Amazon Titan

Anthropic

Cohere

DeepSeek

Google

Kimi AI

隨需定價

中繼

MiniMax AI

Mistral AI

NVIDIA

OpenAI

TwelveLabs

Stability AI

Writer

Qwen

自訂模型匯入

工具和最佳化定價詳細資訊

Amazon Bedrock Flows

Amazon Bedrock 防護機制

模型評估

資料自動化

針對 Amazon Bedrock 的提示最佳化

定價範例

AI21 Labs

Amazon

隨需定價

自訂 (微調和持續預先訓練) 定價

佈建輸送量定價

Amazon Bedrock 防護機制

Amazon Bedrock 知識庫

Anthropic

隨需定價

佈建輸送量定價

Cohere

隨需定價

自訂 (微調) 定價

自訂模型匯入

資料自動化

DeepSeek

流程

中繼

隨需定價

自訂 (微調) 定價

佈建輸送量定價

Mistral AI

隨需定價

模型評估

模型評估範例 1︰

模型評估範例 2︰

提示最佳化