Amazon Bedrock 定價

定價概觀

Amazon Bedrock 是一項全受管服務,可透過單一 API 提供各種高效能基礎模型 (FM) 選擇,並隨附建置具有安全性、隱私和負責任 AI 的生成式 AI 應用程式所需的廣泛功能。

使用 Amazon Bedrock 後,您將需支付模型推論和自訂費用。您有兩個定價計劃可供選擇進行推論:1.隨選和批次:此模式可讓您以依用量計費方式使用 FM,而無需作出任何以時間為基礎的期限承諾。2.佈建輸送量:此模式可讓您佈建足夠的輸送量來滿足應用程式的效能需求,以換取以時間為基礎的期限承諾。

定價模式

隨需

使用隨需模式,您只需為用量付費,而無需基於時間的期限承諾。針對文字生成模型,處理的每個輸入字符和生成的每個輸出字符都會向您收費。針對嵌入模型,處理的每個輸入字符都會向您收費。字符由幾個字元組成,是指模型學習了解使用者輸入和提示的基本文字單元。針對影像生成模型,每個生成的影像都會向您收費。

批次

使用批次模式,您可以提供一組提示作為單一輸入檔案,並接收回應作為單一輸出檔案,讓您能夠同時獲得大規模預測。回應已經過處理並儲存在 Amazon S3 儲存貯體中,以便您稍後存取。批次模式的定價與隨需模式的定價相同。

佈建輸送量

使用佈建輸送量模式,您可以為特定基礎或自訂模型購買模型單元。佈建輸送量模式主要針對需要保證輸送量的大型一致性推論工作負載而設計。自訂模型只能使用佈建輸送量來存取。模型單元提供一定的輸送量,該輸送量是透過每分鐘處理的輸入或輸出字符的最大數量進行衡量。使用「佈建輸送量」定價,將按小時向您收費,您可以靈活選擇 1 個月或 6 個月的承諾期限。

模型自訂

透過 Amazon Bedrock,您可以使用資料自訂 FM,以針對特定任務和業務環境提供量身打造的回應。您可以使用標記資料微調模型,也可以使用未標記資料繼續進行預先訓練。對於文本生成模型的自訂,您必須根據模型處理的總字符數量 (訓練資料語料庫中的字符數量乘以時期數量) 支付模型訓練費用,並依照每個模型每月支付模型儲存費用。時期是指在微調或持續預先訓練過程中,對訓練資料集進行的一次完整傳遞。使用自訂模型的推論會根據佈建輸送量計畫收費,且需購買佈建輸送量。模型單元可在無承諾期限的情況下,用於對自訂模型進行推論。我們會根據您用於自訂模型推論的第一個模型單元的小時數向您收費。如果您想將輸送量提高到超過一個模型單元,則必須購買 1 個月或 6 個月的承諾期限。

模型評估

使用 Amazon Bedrock 上的模型評估,您可以根據使用量付費,而無需事先承諾提示或回應的數量。對於自動評估,您只需支付評估中所選模型的推論費用。自動生成的演算法分數為免費提供。對於您自帶工作團隊的人工評估,您需要支付評估中的模型推論費用,以及每完成一項人工任務 0.21 USD 的費用。人工任務定義為當人類工作者在人工評估使用者介面,提交單一提示及其相關推論回應的評估時發生的事件。無論您在評估任務中有一個還是兩個模型,價格都相同,包含的評估指標和評分方法均不受影響。人工任務費用會顯示在 AWS 帳單中的 Amazon SageMaker 區段中,且所有 AWS 區域均相同。由於人力由您提供,所以人力無需另外收費。針對 AWS 管理的評估,在與 AWS 專家評估團隊合作時,定價依私人參與中的評估需求自訂。

強大的建置工具,無需額外收費

使用 Amazon Bedrock 代理程式和 Amazon Bedrock 知識庫時,您只需為使用這些功能的模型和向量資料庫付費。

定價明細

定價取決於模式、供應商和模型。請選擇模型供應商以查看詳細定價。

AI21 Labs

隨需和批次定價

AI21 Labs 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價

Jurassic-2 Mid

0.0125 USD

0.0125 USD

Jurassic-2 Ultra

0.0188 USD

0.0188 USD

Amazon

區域

Anthropic

隨需和批次定價

區域:美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價

Claude Instant

0.0008 USD

0.0024 USD

Claude 2.0/2.1

0.008 USD

0.024 USD

Claude 3 Opus*

0.015 USD

0.075 USD

Claude 3 Sonnet

0.003 USD

0.015 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

*目前可在美國西部 (奧勒岡) 區域使用 Claude 3 Opus

區域:亞太地區 (雪梨)

Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價

Claude 3 Sonnet

0.003 USD

0.015 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

區域:歐洲 (巴黎)

Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價

Claude 3 Sonnet

0.003 USD

0.015 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

區域:亞太地區 (東京)

Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價

Claude Instant

0.0008 USD

0.0024 USD

Claude 2.0/2.1

0.008 USD

0.024 USD

區域:歐洲 (法蘭克福)

Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價

Claude Instant

0.0008 USD

0.0024 USD

Claude 2.0/2.1

0.008 USD

0.024 USD

佈建輸送量定價

區域:美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

Anthropic 模型 每個模型每小時價格,
無承諾
每個模型單元每小時定價,1 個月承諾 每個模型單元每小時定價,6 個月承諾

Claude Instant

44.00 USD

39.60 USD

22.00 USD

Claude 2.0/2.1

70.00 USD

63.00 USD

35.00 USD

Anthropic 模型 每個模型每小時價格,
無承諾
每個模型單元每小時定價,1 個月承諾 每個模型單元每小時定價,6 個月承諾

Claude Instant

44.00 USD

39.60 USD

22.00 USD

Claude 2.0/2.1

70.00 USD

63.00 USD

35.00 USD

區域:亞太區域 (東京)

Anthropic 模型 每個模型單元每小時定價,1 個月承諾 每個模型單元每小時定價,6 個月承諾

Claude Instant

53.00 USD

29.00 USD

Claude 2.0/2.1

86.00 USD

48.00 USD

區域:歐洲 (法蘭克福)

Anthropic 模型 每個模型單元每小時定價,1 個月承諾 每個模型單元每小時定價,6 個月承諾

Claude Instant

49.00 USD

27.00 USD

Claude 2.0/2.1

79.00 USD

44.00 USD

請聯絡您的 AWS 客戶團隊,以取得有關模型單元的更多詳細資訊。 

Cohere

隨需和批次定價

Cohere 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價
Command 0.0015 USD 0.0020 USD
Command-Light 0.0003 USD 0.0006 USD
Command R+ 0.0030 USD 0.0150 USD
Command R 0.0005 USD 0.0015 USD
Embed – 英文 0.0001 USD 不適用
Embed – 多語言 0.0001 USD 不適用

自訂定價 (微調)

Cohere 模型 訓練 1,000 個字符的定價 每月儲存每個自訂模型的定價 根據自訂模型每小時每模型單元推斷的定價 (無承諾佈建輸送量定價)

Cohere Command

0.004 USD

1.95 USD

49.50 USD

Cohere Command-Light 0.001 USD

1.95 USD

8.56 USD

*訓練的字符總數 = 訓練資料語料庫中的字符數量 x 時期數

佈建輸送量定價

Cohere 模型 每個模型每小時價格, 
無承諾
每個模型單元每小時定價,1 個月承諾

每個模型單元每小時定價,6 個月承諾

Cohere Command

49.50 USD

39.60 USD

23.77 USD

Cohere Command – Light 8.56 USD

6.85 USD

4.11 USD
Embed – 英文 7.12 USD

6.76 USD

6.41 USD
Embed – 多語言 7.12 USD

6.76 USD

6.41 USD

請聯絡您的 AWS 客戶或銷售團隊,以取得有關模型單元的更多詳細資訊。 

Meta Llama

隨需和批次定價

Meta 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價

Llama 2 Chat (130 億)

0.00075 USD

0.001 USD

Llama 2 Chat (700 億)

0.00195 USD

0.00256 USD
Llama 3 Instruct (80 億)

0.0004 USD

0.0006 USD
Llama 3 Instruct (700 億)

0.00265 USD

0.0035 USD

模型自訂定價 (微調)

Meta 模型 訓練 1,000 個字符的定價 每月儲存每個自訂模型* 的定價 根據自訂模型每小時 1 個模型單元推斷的定價 (無承諾佈建輸送量定價)

Llama 2 預先訓練 (130 億)

0.00149 USD

1.95 USD

23.50 USD

Llama 2 預先訓練 (700 億)

0.00799 USD

1.95 USD 23.50 USD

*自訂模型儲存 = 1.95 USD

佈建輸送量定價

Meta 模型 每個模型單元每小時定價,1 個月承諾 每個模型單元每小時定價,6 個月承諾

Llama 2 預先訓練及 Chat (130 億)

21.18 USD

13.08 USD

Llama 2 預先訓練 (700 億)

21.18 USD

13.08 USD

*Llama 2 預先訓練模型僅在自訂後的佈建輸送量中可用。

請聯絡您的 AWS 客戶或銷售團隊,以取得有關模型單元的更多詳細資訊。

Mistral AI

區域
區域

Stability AI

隨需和批次定價

Stability AI 提供的影像模型依影像定價,具體取決於步驟數和影像解析度

Stability AI 模型 影像解析度 生成每張標準品質影像的定價 (<=50 個步驟) 生成每張標準品質影像的定價 (> 50 個步驟)

 

SDXL 0.8

512 x 512 或更小

每個影像 0.018 USD

每個影像 0.036 USD

大於 512 x 512

每個影像 0.036 USD

每個影像 0.072 USD

SDXL 1.0

最多 1024 x 1024

0.04 USD 0.08 USD

佈建輸送量定價

Stability AI 模型 每個模型單元每小時定價,1 個月承諾* 每個模型單元每小時定價,6 個月承諾*

SDXL 1.0

49.86 USD

46.18 USD

*包括基本和自訂模型的推論

請聯絡您的 AWS 客戶或銷售團隊,以取得有關模型單元的更多詳細資訊。

目前,Amazon Bedrock 上的 Stability AI 模型不支援模型自訂 (微調)。

Amazon Bedrock 防護機制

隨需定價

防護機制政策* 每 1000 個文字單元的價格**

內容過濾器

0.75 USD

拒絕主題

1 USD

敏感資訊過濾器 (個人身份識別資訊 (Personally Identifiable Information, PII))

0.10 USD

敏感資訊過濾器 (標準表達式)  免費
文字過濾器

免費

* 每個防護機制政策皆為選用,可以根據您的應用程式需求啟用。將根據防護機制中使用的政策類型計費。例如,如果設定了內容過濾器和拒絕主題防護機制,則僅會收取這兩個政策的費用,而不會收取與敏感資訊過濾器相關的費用。

** 一個文字單元最多可包含 1000 個字元。如果文字輸入超過 1000 個字元,則會視為多個文字單元處理,每個單元將包含至多 1000 個字元。例如,如果文字輸入包含 5600 個字元,則將收取 6 個文字單元的費用。


防護機制不支援影像和嵌入。

定價範例

  • 應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 AI21 的 Jurassic-2 Mid 模型將輸入文字的 10,000 個字符輸入結果,總結為 2000 個字符的輸出結果。

    產生的總成本 = 10,000 個字符/1000 * 0.0125 USD + 2000 個字符/1000 * 0.0125 USD = 0.15 USD

  • 隨需定價

    應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫:要求 Amazon Titan Text Lite 模型將輸入文字的 2000 個字符輸入結果,總結為 1000 個字符的輸出結果。

    每小時產生的總成本 = 2000 個字符/1000 * 0.0003 USD + 1000 個字符/1000 * 0.0004 USD = 0.001 USD。

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 Amazon Titan 影像產生器模型產生 1000 個 1024 x 1024 大小的標準品質映像。

    產生的總成本 = 1000 個映像 * 每個映像 0.01 USD = 10 USD

    自訂 (微調和持續預先訓練) 定價

    應用程式開發人員使用 1000 個影像/文字配對自訂 Amazon Titan 影像產生模型。訓練後,開發人員會使用自訂模型佈建輸送量 1 小時來評估模型的效能。微調的模型會儲存 1 個月。評估後,開發人員會使用佈建輸送量 (1 個月使用期) 來託管自訂模型。

    每月微調成本為:微調訓練 (0.005 * 500 * 64 USD),其中 0.005 USD 是每張看到之影像的定價,500 是步驟數,64 是批次大小 + 每月自訂模型儲存 (1.95 USD) + 1 小時自訂模型推論 (21 USD) = 160 + 1.95 + 21 USD = 182.95 USD

    佈建輸送量定價

    應用程式開發人員購買兩個 Amazon Titan Text Express 模型單元,且其文字摘要使用案例的期限為 1 個月。

    每月產生的總成本 = 2 個模型單元 * 18.40 USD/小時 * 24 小時 * 31 天 = 27,379.20 USD

    應用程式開發人員購買一個基礎 Amazon Titan 影像產生器模型的模型單元,且使用期限為 1 個月。

    產生的總成本 = 1 個模型單元 * 16.20 USD * 24 小時 * 31 天 = 12,052.80 USD

  • 隨需定價

    應用程式開發人員針對美國西部 (奧勒岡) 地區的 Amazon Bedrock 發出下列 API 呼叫:要求 Anthropic 的 Claude 模型將輸入文字的 11,000 個字符輸入結果,總結為 4000 個字符的輸出結果。

    產生的總成本 = 11,000 個字符/1000 * 0.008 USD + 4000 個字符/1000 * 0.024 USD = 0.088 USD + 0.096 USD = 0.184 USD

    佈建輸送量定價

    應用程式開發人員在美國西部 (奧勒岡) 地區購買一個 Anthropic Claude Instant 的模型單元:

    每月產生的總成本 = 1 個模型單元 * 39.60 USD * 24 小時 * 31 天 = 29,462.40 USD

  • 隨需定價

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 Cohere 的 Command 模型將輸入文字的 6000 個字符輸入結果,總結為 2000 個字符的輸出結果。

    產生的總成本 = 6000 個字符/1,000 * 0.0015 USD + 2000 個字符/1,000 * 0.0020 USD = 0.013 USD

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 Cohere 的 Command - Light 模型將輸入文字的 6000 個字符輸入結果,總結為 2000 個字符的輸出結果。

    產生的總成本 = 6000 個字符/1000 * 0.0003 USD + 2000 個字符/1000 * 0.0006 USD = 0.003 USD

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 Cohere 的 Embed English 或 Embed Multilingual 模型產生 10,000 個字符輸入結果的嵌入。

    產生的總成本 = 10,000 個字符/1000 * 0.0001 USD = 0.001 USD

    自訂 (微調) 定價

    應用程式開發人員使用 1000 個資料字符自訂 Cohere Command 模型。訓練後,使用自訂模型佈建輸送量 1 小時來評估模型的效能。微調的模型會儲存 1 個月。評估後,開發人員會使用佈建輸送量 (1 個月使用期) 來託管自訂模型。

    微調每月產生的成本為:微調訓練 (0.004 USD * 1000) + 每月自訂模型儲存 (1.95 USD) + 1 小時自訂模型推論 (49.50 USD) = 55.45 USD

    自訂模型的佈建輸送量 (1 個月使用期) 產生的每月成本 = 39.60 USD

    佈建輸送量定價

    應用程式開發人員購買一個 Cohere Command 模型單元,且其文字摘要使用案例的期限為 1 個月。

    每月產生的總成本 = 1 個模型單元 * 39.60 USD * 24 小時 * 31 天 = 29,462.40 USD

  • 隨需定價

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 Meta 的 Llama 2 Chat (130 億) 模型將輸入文字的 2000 個字符輸入結果,總結為 500 個字符的輸出結果。

    產生的總成本 = 2000 個字符/1000 * 0.00075 USD + 500 個字符/1000 * 0.001 USD = 0.002 USD

    自訂 (微調) 定價

    應用程式開發人員使用 1000 個資料字符自訂 Llama 2 預先訓練 (700 億) 模型。訓練後,使用自訂模型佈建輸送量 1 小時來評估模型的效能。微調的模型會儲存 1 個月。評估後,開發人員會使用佈建輸送量 (1 個月使用期) 來託管自訂模型。

    微調每月產生的成本為:微調訓練 (0.00799 USD * 1000) + 每月自訂模型儲存 (1.95 USD) + 1 小時自訂模型推論 (23.50 USD) = 33.44 USD

    自訂模型的佈建輸送量 (1 個月使用期) 產生的每月成本 = 21.18 USD

    佈建輸送量定價

    應用程式開發人員購買一個 Meta Llama 2 模型單元,且其文字摘要使用案例的期限為 1 個月。

    每月產生的總成本為 1 個模型單元 * 21.18 USD * 24 小時 * 31 天 = 15,757.92 USD

  • 隨需定價

    應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫:要求 Mistral 7B 模型將輸入文字的 2000 個字符輸入結果,總結為 1000 個字符的輸出結果。

    每小時產生的總成本 = 2000 個字符/1000 * 0.00015 USD + 1000 個字符/1000 * 0.0002 USD = 0.0005 USD

    應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫:要求 Mixtral 8x7B 模型將輸入文字的 2000 個字符輸入結果,總結為 1000 個字符的輸出結果。

    每小時產生的總成本 = 2000 個字符/1000 * 0.00045 USD + 1000 個字符/1000 * 0.0007 USD = 0.0016 USD

    應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫:要求 Mistral 大型模型將輸入文字的 2000 個字符輸入結果,總結為 1000 個字符的輸出結果。 

    每小時產生的總成本 = 2000 個字符/1000 * 0.008 USD + 1000 個字符/1000 * 0.024 USD = 0.04 USD

  • 隨需定價

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 SDXL 模型產生 512 x 512 大小、步長為 70 的映像 (高品質)。

    產生的總成本 = 1 個映像 * 每個映像 0.036 USD = 0.036 USD

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 SDXL 1.0 模型產生 1024 x 1024 大小、步長為 70 的映像 (高品質)。

    產生的總成本 = 1 個映像 * 每個映像 0.08 USD = 0.08 USD

    佈建輸送量定價

    應用程式開發人員購買一個 SDXL 1.0 模型單元,且使用期為 1 個月。

    產生的總成本 = 1 * 49.86 USD * 24 小時 * 31 天 = 37,095.84 USD

  • 模型評估範例 1︰

    隨需定價
    應用程式開發人員在美國東部 (維吉尼亞北部) AWS 區域使用 Anthropic Claude 2.1 和 Anthropic Claude Instant,提交資料集進行人工模型評估。

    資料集包含 50 個提示,開發人員需要 1 名工作者對每個提示回應集進行評分 (可在建立評估任務時設定為「每個提示的工作者」參數)。

    此評估任務中將有 50 項任務 (每位工作者每個提示回應組為 1 項任務)。50 個提示共計為 5000 個輸入字符,相關的回應共計 15000 個字符 (使用 Anthropic Claude Instant) 和 20000 個字符 (使用 Anthropic Claude 2.1)。

    此模型評估任務會產生下列費用:

    項目 輸入字符數 每 1,000 個輸入字符的定價 輸入成本 輸出字符數 每 1,000 個輸出字符的定價 輸出成本 人工任務數目 每項人工任務的價格 人工任務的成本 總計
    Claude Instant Inference 5000 0.0008 USD 0.004 USD 15,000 0.0024 USD 0.036 USD       0.04 USD
    Claude 2.1 Inference 5000 0.008 USD 0.04 USD 20,000 0.024 USD 0.48 USD       0.52 USD
    人工任務             50 0.21 USD 10.50 USD 10.50 USD
    總計                   11.06 USD

    模型評估範例 2︰

    隨需定價
    應用程式開發人員在美國東部 (維吉尼亞北部) AWS 區域使用 Anthropic Claude 2.1 和 Anthropic Claude Instant,提交資料集進行人工模型評估。

    資料集包含 50 個提示,開發人員需要 2 名工作者對每個提示回應集進行評分 (可在建立評估任務時設定為「每個提示的工作者」參數)。此評估任務中將有 100 項任務 (每位工作者每個提示回應組為 1 項任務:2 個工作者 x 50 個快速回應集 = 100 個人工任務)。

    50 個提示共計為 5000 個輸入字符,相關的回應共計 15000 個字符 (使用 Anthropic Claude Instant) 和 20000 個字符 (使用 Anthropic Claude 2.1)。

    此模型評估任務會產生下列費用:

    項目 輸入字符數 每 1,000 個輸入字符的定價 輸入成本 輸出字符數 每 1,000 個輸出字符的定價 輸出成本 人工任務數目 每項人工任務的價格 人工任務的成本 總計
    Claude Instant Inference 5000 0.0008 USD 0.0040 USD 15000 0.0024 USD 0.036 USD       0.04 USD
    Claude 2.1 Inference 5000 0.008 USD 0.0400 USD 20,000 0.024 USD 0.48 USD       0.52 USD
    人工任務             100 0.21 USD 21.00 USD 21.00 USD
    總計                   21.56 USD
  • 範例 1:客戶支援聊天機器人
    一名應用程式開發人員建立了一個客戶支援聊天機器人,並使用內容過濾器封鎖有害內容和拒絕主題,以過濾不想要的查詢和回應。

    聊天機器人每小時提供 1000 個用戶查詢。每個使用者查詢的平均輸入長度為 200 個字元,並接收 1500 個字元的 FM 回應。

    每個 200 個字元的使用者查詢對應於 1 個文字單元。

    每個 1500 個字元的 FM 回應對應於 2 個文字單元。

    每小時處理的文字單元 = (1 + 2) * 1000 個查詢 = 3000 個文字單元

    內容過濾器和拒絕主題每小時產生的總成本 = 3000 * (0.75 USD + 1.00 USD) /1000 = 5.25 USD

     

    範例 2:呼叫中心轉錄摘要
    一名應用程式開發人員建立了一個應用程式,以彙總使用者與客服人員之間的聊天記錄。它使用敏感信息過濾器編輯 10,000 個對話的生成摘要中的個人身分識別資訊 (PII)。

    每個生成的摘要平均有 3500 個字元,對應於 4 個文字單元。

    總結 10,000 次對話所產生的總成本 = 10000 * 4 * (0.1/1000 USD) = 4 USD

    項目 輸入字符數 每 1,000 個輸入字符的定價 輸入成本 輸出字符數 每 1,000 個輸出字符的定價 輸出成本 人工任務數目 每項人工任務的價格 人工任務的成本 總計
    Claude Instant Inference 5000 0.0008 USD 0.004 USD 15,000 0.0024 USD 0.036 USD       0.04 USD
    Claude 2.1 Inference 5000 0.008 USD 0.04 USD 20,000 0.024 USD 0.48 USD       0.52 USD
    人工任務             100 0.21 USD 21.00 USD 21.00 USD
    總計                   21.56 USD