Amazon Bedrock 定價

定價概觀

Amazon Bedrock 是一項全受管服務,可透過單一 API 提供各種高效能基礎模型 (FM) 選擇,並隨附建置具有安全性、隱私和負責任 AI 的生成式 AI 應用程式所需的廣泛功能。

使用 Amazon Bedrock 後,您將需支付模型推論和自訂費用。您有兩個定價計劃可供選擇進行推論:1.隨選和批次:此模式可讓您以依用量計費方式使用 FM,而無需作出任何以時間為基礎的期限承諾。2.佈建輸送量:此模式可讓您佈建足夠的輸送量來滿足應用程式的效能需求,以換取以時間為基礎的期限承諾。

定價模式

使用隨需模式,您只需為用量付費,而無需基於時間的期限承諾。針對文字生成模型,處理的每個輸入字符和生成的每個輸出字符都會向您收費。針對嵌入模型,處理的每個輸入字符都會向您收費。字符由幾個字元組成,是指模型學習了解使用者輸入和提示的基本文字單元。針對影像生成模型,每個生成的影像都會向您收費。跨區域推論:隨需模式也支援某些模型的跨區域推論。其可讓開發人員利用不同 AWS 區域的運算,順暢地管理高載流量,並獲得更高的輸送量限制和更佳的彈性。您無須為使用跨區域推論支付額外的費用,而且該服務會根據您提出請求的區域 (來源區域) 進行計費。

使用批次模式,您可以提供一組提示作為單一輸入檔案,並接收回應作為單一輸出檔案,讓您能夠同時獲得大規模預測。回應已經過處理並儲存在 Amazon S3 儲存貯體中,以便您稍後存取。Amazon Bedrock 提供 Anthropic、Meta、Mistral AI 和 Amazon 等領先 AI 供應商提供的精選基礎模型 (FM),相較於隨需推論定價,能夠以低一半的價格獲得批次推論。請參閱此處的模型清單。

使用佈建輸送量模式,您可以為特定基礎或自訂模型購買模型單元。佈建輸送量模式主要針對需要保證輸送量的大型一致性推論工作負載而設計。自訂模型只能使用佈建輸送量來存取。模型單元提供一定的輸送量,該輸送量是透過每分鐘處理的輸入或輸出字符的最大數量進行衡量。使用「佈建輸送量」定價,將按小時向您收費,您可以靈活選擇 1 個月或 6 個月的承諾期限。

透過 Amazon Bedrock,您可以使用資料自訂 FM,以針對特定任務和業務環境提供量身打造的回應。您可以使用標記資料微調模型,也可以使用未標記資料繼續進行預先訓練。對於文本生成模型的自訂,您必須根據模型處理的總字符數量 (訓練資料語料庫中的字符數量乘以時期數量) 支付模型訓練費用,並依照每個模型每月支付模型儲存費用。時期是指在微調或持續預先訓練過程中,對訓練資料集進行的一次完整傳遞。使用自訂模型的推論會根據佈建輸送量計畫收費,且需購買佈建輸送量。模型單元可在無承諾期限的情況下,用於對自訂模型進行推論。我們會根據您用於自訂模型推論的第一個模型單元的小時數向您收費。如果您想將輸送量提高到超過一個模型單元,則必須購買 1 個月或 6 個月的承諾期限。

自訂模型匯入可讓您利用在 Amazon Bedrock 內開發的舊有自訂模型,並像使用 Bedrock 現有的託管基礎模型一樣,以全受管方式使用它們。您可以匯入受支援模型架構的自訂權重,並使用隨需模式來提供自訂模型。將自訂模型導入 Bedrock 無需費用。匯入模型後,您即可隨需存取模型,而無需執行任何控制平面動作。僅依據服務推論磁碟區所需的自訂模型副本數目,以及每個模型副本出於作用中的持續時間 (以 5 分鐘時段計費),才會向您收取模型推論費用。模型副本是匯入模型的單一執行個體,可隨時提供推論請求。每分鐘模型副本的價格取決於架構、內容長度、AWS 區域、運算單位版本 (硬體產生) 等因素,並依模型副本大小進行分級。

進階工具

Amazon Bedrock 代理程式可讓您在應用程式中,建置和設定自主代理程式。這些代理程式可安全地連線到貴公司的資料來源,並使用正確的資訊增強使用者請求,以產生準確的回應。您只需完成幾個簡單步驟即可在 Amazon Bedrock 中建立代理程式,進而縮短建置生成式 AI 應用程式所需的時間。這些代理程式支援程式碼解釋,以動態產生和執行程式碼,以及控制返回,這可讓您定義動作架構,並在代理程式調用動作時取得控管。此外,Amazon Bedrock 代理程式能夠在各種互動中保留記憶,提供更個人化且無縫的使用者體驗。

Amazon Bedrock 防護機制可協助您為生成式 AI 應用程式實作自訂防護措施和負責任 AI 政策。除了 FM 提供的原生保護之外,它還提供額外的可自訂安全保護。Amazon Bedrock 防護機制是主要雲端供應商提供的唯一負責任 AI 功能,可協助讓客戶在單一解決方案中為其生成式 AI 應用程式建立和自訂安全、隱私和真實性保護,並且適用於 Amazon Bedrock 中的所有 FM 以及微調模型。Bedrock 防護機制也可與 Amazon Bedrock 代理程式和 Amazon Bedrock 知識庫整合,以建置符合您負責任 AI 政策之生成式 AI 應用程式。此外,Bedrock 防護機制還提供 ApplyGuardrail API,協助評估使用者輸入和 Bedrock 以外任何自訂或第三方 FM 產生的模型回應。

Amazon Bedrock Flows 是適用於生成式 AI 應用程式的 Bedrock 工作流程編寫和執行功能。該功能透過直觀的視覺化產生器和一組 API,加速使用者定義生成式 AI 工作流程的建立、測試和部署。它可讓您順暢地連結最新的基礎模型、提示、代理程式、知識庫、防護機制和 AWS 服務 (例如 Amazon Lex、AWS Lambda、Amazon S3) 以及業務邏輯,從而建置生成式 AI 工作流程。您可以輕鬆測試和版本化工作流程,並透過視覺化介面或 API 在安全的無伺服器環境中執行工作流程,而無需建立自己的基礎設施。

使用 Amazon Bedrock 上的模型評估,您可以根據使用量付費,而無需事先承諾提示或回應的數量。對於自動評估,您只需支付評估中所選模型的推論費用。自動生成的演算法分數為免費提供。對於您自帶工作團隊的人工評估,您需要支付評估中的模型推論費用,以及每完成一項人工任務 0.21 USD 的費用。人工任務定義為當人類工作者在人工評估使用者介面,提交單一提示及其相關推論回應的評估時發生的事件。無論您在評估任務中有一個還是兩個模型,價格都相同,包含的評估指標和評分方法均不受影響。人工任務費用會顯示在 AWS 帳單中的 Amazon SageMaker 區段中,且所有 AWS 區域均相同。由於人力由您提供,所以人力無需另外收費。針對 AWS 管理的評估,在與 AWS 專家評估團隊合作時,定價依私人參與中的評估需求自訂。

Amazon Bedrock 知識庫提供完全受管的端對端擷取增強生成 (RAG) 工作流程,讓 FM 和代理程式能夠從公司私有資料來源,存取前後關聯資訊。這使他們能夠提供更相關、準確和自訂的回應。您可以安全地將 FM 和代理程式連接到多個資料來源,例如 Amazon S3、Confluence、Salesforce 和 SharePoint。如果您尚未擁有現有的向量資料庫,Amazon Bedrock 會為您建立 Amazon OpenSearch Serverless 向量存放區。或者,您也可以在支援的資料庫中指定現有向量存放區,例如 Amazon OpenSearch Serverless、Pinecone 和 Redis Enterprise Cloud、Amazon Aurora 和 MongoDB。您也可以透過非結構化資料的進階解析選項、資料區塊選項 (例如自訂區塊) 或內建的區塊策略 (包括預設、固定大小、無分割、階層分割或語意分割),微調擷取和導入內容,以在各個使用案例中獲得更高的準確性。

定價詳細資訊

定價取決於模式、供應商和模型。請選擇模型供應商以查看詳細定價。

Amazon Bedrock 提供 Anthropic、Meta、Mistral AI 和 Amazon 等領先 AI 供應商提供的精選基礎模型 (FM),相較於隨需推論定價,能夠以低一半的價格獲得批次推論。請參閱此處的模型清單。

  • AI21 Labs
  • AI21 Labs

    隨需定價

    AI21 Labs 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價
    Jamba 1.5 Large 0.002 USD 0.008 USD
    Jamba 1.5 Mini 0.0002 USD 0.0004 USD
    Jurassic-2 Mid 0.0125 USD 0.0125 USD
    Jurassic-2 Ultra 0.0188 USD 0.0188 USD
    Jamba-Instruct 0.0005 USD 0.0007 USD
  • Amazon
  • Amazon

  • Anthropic
  • Anthropic

    隨需和批次定價

    區域:美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude 3.5 Sonnet**

    0.003 USD

    0.015 USD

    0.0015 USD

    0.0075 USD

    Claude 3.5 Haiku

    0.001 USD

    0.005 USD

    0.0005 USD

    0.0025 USD

    Claude 3 Opus*

    0.015 USD

    0.075 USD

    0.0075 USD

    0.0375 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

    0.000625 USD

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

    0.0075 USD

    Claude 2.1

    0.008 USD

    0.024 USD

    Claude 2.0

    0.008 USD

    0.024 USD

    Claude Instant

    0.0008 USD

    0.0024 USD

    *目前可在美國西部 (奧勒岡) 區域使用 Claude 3 Opus
    **Claude 3.5 Sonnet 的價格適用於每個版本的 Claude 3.5 Sonnet (v1 和 v2) – Claude 3.5 Sonnet v2 目前在美國西部 (奧勒岡) 區域提供

    區域:歐洲 (倫敦)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD 0.0075 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

    0.000625 USD

    區域:歐洲 (蘇黎世)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude 3.5 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

    0.0075 USD

     

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

     

    區域:南美洲 (聖保羅)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

    0.0075 USD

     

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

     

    區域:加拿大 (中部)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    區域:亞太地區 (孟買)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    區域:亞太地區 (雪梨)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    區域:亞太地區 (東京)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude Instant

    0.0008 USD

    0.0024 USD

     

    Claude 2.0/2.1

    0.008 USD

    0.024 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    Claude 3.5 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    區域:亞太地區 (新加坡)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude Instant

    0.0008 USD

    0.0024 USD

    0.0004 USD

     

    0.0012 USD

    Claude 2.0/2.1

    0.008 USD

    0.024 USD

    0.004 USD

     

    0.012 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    Claude 3.5 Sonnet

    0.003 USD

    0.015 USD

    區域:歐洲 (巴黎)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    區域:歐洲 (法蘭克福)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude Instant

    0.0008 USD

    0.0024 USD

    Claude 2.0/2.1

    0.008 USD

    0.024 USD

    Claude 3 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    Claude 3.5 Sonnet

    0.003 USD

    0.015 USD

    0.0015 USD

     

    0.0075 USD

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

    0.000125 USD

     

    0.000625 USD

    區域:亞太地區 (首爾)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude 3.5 Sonnet

    0.003 USD

    0.015 USD

     

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

     

    區域:美國東部 (俄亥俄)

    Anthropic 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價 每 1,000 個輸入字符的定價 (批次) 每 1,000 個輸出字符的定價 (批次)

    Claude 3.5 Sonnet

    0.003 USD

    0.015 USD

     

    Claude 3 Haiku

    0.00025 USD

    0.00125 USD

     

    佈建輸送量定價

    區域:美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

    Anthropic 模型 每個模型每小時價格,
    無承諾
    每個模型單元每小時定價,1 個月承諾 每個模型單元每小時定價,6 個月承諾

    Claude Instant

    44.00 USD

    39.60 USD

    22.00 USD

    Claude 2.0/2.1

    70.00 USD

    63.00 USD

    35.00 USD

    Anthropic 模型 每個模型每小時價格,
    無承諾
    每個模型單元每小時定價,1 個月承諾 每個模型單元每小時定價,6 個月承諾

    Claude Instant

    44.00 USD

    39.60 USD

    22.00 USD

    Claude 2.0/2.1

    70.00 USD

    63.00 USD

    35.00 USD

    區域:亞太區域 (東京)

    Anthropic 模型 每個模型單元每小時定價,1 個月承諾 每個模型單元每小時定價,6 個月承諾

    Claude Instant

    53.00 USD

    29.00 USD

    Claude 2.0/2.1

    86.00 USD

    48.00 USD

    區域:歐洲 (法蘭克福)

    Anthropic 模型 每個模型單元每小時定價,1 個月承諾 每個模型單元每小時定價,6 個月承諾

    Claude Instant

    49.00 USD

    27.00 USD

    Claude 2.0/2.1

    79.00 USD

    44.00 USD

    請聯絡您的 AWS 客戶團隊,以取得有關模型單元的更多詳細資訊。 

  • Cohere
  • Cohere

    隨需定價

    Cohere 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價
    Command 0.0015 USD 0.0020 USD
    Command-Light 0.0003 USD 0.0006 USD
    Command R+ 0.0030 USD 0.0150 USD
    Command R 0.0005 USD 0.0015 USD
    Embed – 英文 0.0001 USD 不適用
    Embed – 多語言 0.0001 USD 不適用

    自訂定價 (微調)

    Cohere 模型 訓練 1,000 個字符的定價 每月儲存每個自訂模型的定價 根據自訂模型每小時每模型單元推斷的定價 (無承諾佈建輸送量定價)

    Cohere Command

    0.004 USD

    1.95 USD

    49.50 USD

    Cohere Command-Light 0.001 USD

    1.95 USD

    8.56 USD

    *訓練的字符總數 = 訓練資料語料庫中的字符數量 x 時期數

    佈建輸送量定價

    Cohere 模型 每個模型每小時價格, 
    無承諾
    每個模型單元每小時定價,1 個月承諾

    每個模型單元每小時定價,6 個月承諾

    Cohere Command

    49.50 USD

    39.60 USD

    23.77 USD

    Cohere Command – Light 8.56 USD

    6.85 USD

    4.11 USD
    Embed – 英文 7.12 USD

    6.76 USD

    6.41 USD
    Embed – 多語言 7.12 USD

    6.76 USD

    6.41 USD

    請聯絡您的 AWS 客戶或銷售團隊,以取得有關模型單元的更多詳細資訊。 

  • Meta Llama
  • Meta Llama

    Llama 3.2

    隨需和批次定價

    Llama 3.1

    隨需和批次定價

    模型自訂定價 (微調)

    佈建輸送量定價

    Llama 3

    隨需定價

    Llama 2

    隨需定價

    區域:美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

    Meta 模型 每 1,000 個輸入字符的定價 每 1,000 個輸出字符的定價

    Llama 2 Chat (130 億)

    0.00075 USD

    0.001 USD

    Llama 2 Chat (700 億)

    0.00195 USD

    0.00256 USD

    模型自訂定價 (微調)

    Meta 模型 訓練 1,000 個字符的定價 每月儲存每個自訂模型* 的定價 根據自訂模型每小時 1 個模型單元推斷的定價 (無承諾佈建輸送量定價)

    Llama 2 預先訓練 (130 億)

    0.00149 USD

    1.95 USD

    23.50 USD

    Llama 2 預先訓練 (700 億)

    0.00799 USD

    1.95 USD 23.50 USD

    *自訂模型儲存 = 1.95 USD

    佈建輸送量定價

    Meta 模型 每個模型單元每小時定價,1 個月承諾 每個模型單元每小時定價,6 個月承諾

    Llama 2 預先訓練及 Chat (130 億)

    21.18 USD

    13.08 USD

    Llama 2 預先訓練 (700 億)

    21.18 USD

    13.08 USD

    *Llama 2 預先訓練模型僅在自訂後的佈建輸送量中可用。

    請聯絡您的 AWS 客戶或銷售團隊,以取得有關模型單元的更多詳細資訊。

  • Mistral AI
  • Mistral AI

  • Stability AI
  • Stability AI

    隨需定價

    Stability AI 模型 每張生成影像的價格
    Stable Image Core 0.04 USD
    SD3 Large 0.08 USD
    Stable Image Ultra 0.14 USD

    Stability AI 提供的上一代影像模型依影像定價,具體取決於步驟數和影像解析度。

    Stability AI 模型 影像解析度 生成每張標準品質影像的定價 (<=50 個步驟) 生成每張標準品質影像的定價 (> 50 個步驟)
    SDXL 1.0 最多 1024 x 1024 0.04 USD 0.08 USD

    佈建輸送量定價

    Stability AI 模型 每個模型單元每小時定價,1 個月承諾* 每個模型單元每小時定價,6 個月承諾*

    SDXL 1.0

    49.86 USD

    46.18 USD

    *包括基本和自訂模型的推論

    請聯絡您的 AWS 客戶或銷售團隊,以取得有關模型單元的更多詳細資訊。

    目前,Amazon Bedrock 上的 Stability AI 模型不支援模型自訂 (微調)。

  • 自訂模型匯入
  • 自訂模型匯入

    • Llama
    • 區域:美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

      自訂模型單位版本 v1.0
      每個自訂模型單元每分鐘的價格* 0.0785 USD
      每個自訂模型單元每月儲存成本 1.95 USD
       
      託管模型所需的自訂模型單元取決於多種因素,尤其是模型架構、模型參數計數和關聯內容長度。所需自訂模型單元的準確數量將在匯入時確定。做為參考,Llama 3.1 8B 128K 模型需要 2 個自訂模型單元,Llama 3.1 70B 128k 模型需要 8 個自訂模型單元。
      *以 5 分鐘時段計費
    • 多模態 Llama
    • 區域:美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

      自訂模型單位版本 v1.0
      每個自訂模型單元每分鐘的價格* 0.0785 USD
      每個自訂模型單元每月儲存成本 1.95 USD
       
      託管模型所需的自訂模型單元取決於多種因素,尤其是模型架構、模型參數計數和關聯內容長度。所需自訂模型單元的準確數量將在匯入時確定。做為參考,Llama 3.2 11B 128K 模型需要 4 個自訂模型單元。
      *以 5 分鐘時段計費
    • Mistral
    • 區域:美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

      自訂模型單位版本 v1.0
      每個自訂模型單元每分鐘的價格* 0.0785 USD
      每個自訂模型單元每月儲存成本 1.95 USD
       
      託管模型所需的自訂模型單元取決於多種因素,尤其是模型架構、模型參數計數和關聯內容長度。所需自訂模型單元的準確數量將在匯入時確定。做為參考,Mistral 7B 32K 模型需要 1 個自訂模型單元。
      *以 5 分鐘時段計費
    • Mixtral
    • 區域:美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

      自訂模型單位版本 v1.0
      每個自訂模型單元每分鐘的價格* 0.0785 USD
      每個自訂模型單元每月儲存成本 1.95 USD
       
      託管模型所需的自訂模型單元取決於多種因素,尤其是模型架構、模型參數計數和關聯內容長度。所需自訂模型單元的準確數量將在匯入時確定。做為參考,Mixtral 8x7B 32K 模型需要 4 個自訂模型單元。
      *以 5 分鐘時段計費
    • Flan
    • 區域:美國東部 (維吉尼亞北部) 及美國西部 (奧勒岡)

      自訂模型單位版本 v1.0
      每個自訂模型單元每分鐘的價格* 0.0785 USD
      每個自訂模型單元每月儲存成本 1.95 USD
       
      託管模型所需的自訂模型單元取決於多種因素,尤其是模型架構、模型參數計數和關聯內容長度。所需自訂模型單元的準確數量將在匯入時確定。做為參考,Flan-T5 XL 512 模型需要 1 個自訂模型單元。 
      *以 5 分鐘時段計費

    隨需推論定價:
    從第一次成功調用開始,模型副本處於作用中期間,系統會以 5 分鐘時段計費。每個模型副本的最大輸送量和並行限制取決於輸入/輸出權杖組合、硬體類型、模型大小、架構、推論最佳化等因素,並在模型匯入工作流程期間確定。

    Bedrock 會視乎您的用量模式自動調整模型副本數目。如果在 5 分鐘期間內沒有調用,Bedrock 會縮減規模至零,並在您調用模型時重新擴展。重新擴展備份時,視乎機型大小,您可能會遇到冷啟動持續時間 (數十秒)。如果您的推論磁碟區持續超過單一模型副本的並行限制,Bedrock 也會擴展模型副本數目。注意:每個帳戶每個匯入模型預設最多可透過 Service Quotas 增加 3 個模型副本。

定價進階工具 (詳細資訊)

  • Flows
  • Amazon Bedrock Flows

    依據執行應用程式所需的節點轉換次數計費。每次在工作流程中執行節點時,Bedrock Flows 會對節點轉換計數。依據所有流程中的節點轉換總數來支付費用。

    自 2025 年 2 月 1 日起,所有費用按天及按月計費。

    每 1,000 次節點轉換的價格
    0.035 USD

    其他費用

    如果應用程式工作流程執行時會利用其他 AWS 服務或傳輸資料,可能會產生其他費用。例如,如果您的工作流程調用 Amazon Bedrock 防護機制政策,則會針對政策處理的文字單位數目計費。 

  • 防護機制
  • Amazon Bedrock 防護機制

    防護機制政策*

    每 1000 個文字單元的價格**

    內容過濾器

    0.75 USD

    拒絕主題

    1 USD

    情境依據檢查***

    0.1 USD

    敏感資訊過濾器 (個人身份識別資訊 (Personally Identifiable Information, PII))

    0.1 USD

    敏感資訊過濾器 (標準表達式) 

    免費

    文字過濾器

    免費

    隨需定價

    * 每個防護機制政策皆為選用,可以根據您的應用程式需求啟用。將根據防護機制中使用的政策類型計費。例如,如果設定了內容過濾器和拒絕主題防護機制,則僅會收取這兩個政策的費用,而不會收取與敏感資訊過濾器相關的費用。

    ** 一個文字單元最多可包含 1000 個字元。如果文字輸入超過 1000 個字元,則會視為多個文字單元處理,每個單元將包含至多 1000 個字元。例如,如果文字輸入包含 5600 個字元,則將收取 6 個文字單元的費用。

    ***情境依據檢查使用參考來源和查詢,來判斷模型回應是否以來源為依據並且與查詢相關。計費的文字單位總數依據來源、查詢和模型回應相結合的所有字元來計算。

    防護機制不支援影像和嵌入。

  • 模型評估
  • 模型評估

    透過您選擇的模型進行推論需要收取模型評估費用。自動生成的演算法分數為免費提供。對於您自帶工作團隊的人工評估,您需要支付評估中的模型推論費用,以及每完成一項人工任務 0.21 USD 的費用。

    型號

    每 1,000 個輸入字符的定價

    每 1,000 個輸出字符的定價

    每項人工任務的價格

     

    選擇用於評估的模型

    根據選擇的模型

    根據選擇的模型

     

    0.21 USD

     

定價範例

  • 應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 AI21 的 Jurassic-2 Mid 模型將輸入文字的 10,000 個字符輸入結果,總結為 2000 個字符的輸出結果。

    產生的總成本 = 10,000 個字符/1000 * 0.0125 USD + 2000 個字符/1000 * 0.0125 USD = 0.15 USD

  • 隨需定價

    應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫:要求 Amazon Titan Text Lite 模型將輸入文字的 2000 個字符輸入結果,總結為 1000 個字符的輸出結果。

    每小時產生的總成本 = 2000 個字符/1000 * 0.0003 USD + 1000 個字符/1000 * 0.0004 USD = 0.001 USD。

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 Amazon Titan 影像產生器模型產生 1000 個 1024 x 1024 大小的標準品質映像。

    產生的總成本 = 1000 個映像 * 每個映像 0.01 USD = 10 USD

    自訂 (微調和持續預先訓練) 定價

    應用程式開發人員使用 1000 個影像/文字配對自訂 Amazon Titan 影像產生模型。訓練後,開發人員會使用自訂模型佈建輸送量 1 小時來評估模型的效能。微調的模型會儲存 1 個月。評估後,開發人員會使用佈建輸送量 (1 個月使用期) 來託管自訂模型。

    每月微調成本為:微調訓練 (0.005 * 500 * 64 USD),其中 0.005 USD 是每張看到之影像的定價,500 是步驟數,64 是批次大小 + 每月自訂模型儲存 (1.95 USD) + 1 小時自訂模型推論 (21 USD) = 160 + 1.95 + 21 USD = 182.95 USD

    佈建輸送量定價

    應用程式開發人員購買兩個 Amazon Titan Text Express 模型單元,且其文字摘要使用案例的期限為 1 個月。

    每月產生的總成本 = 2 個模型單元 * 18.40 USD/小時 * 24 小時 * 31 天 = 27,379.20 USD

    應用程式開發人員購買一個基礎 Amazon Titan 影像產生器模型的模型單元,且使用期限為 1 個月。

    產生的總成本 = 1 個模型單元 * 16.20 USD * 24 小時 * 31 天 = 12,052.80 USD

  • 隨需定價

    應用程式開發人員針對美國西部 (奧勒岡) 地區的 Amazon Bedrock 發出下列 API 呼叫:要求 Anthropic 的 Claude 模型將輸入文字的 11,000 個字符輸入結果,總結為 4000 個字符的輸出結果。

    產生的總成本 = 11,000 個字符/1000 * 0.008 USD + 4000 個字符/1000 * 0.024 USD = 0.088 USD + 0.096 USD = 0.184 USD

    佈建輸送量定價

    應用程式開發人員在美國西部 (奧勒岡) 地區購買一個 Anthropic Claude Instant 的模型單元:

    每月產生的總成本 = 1 個模型單元 * 39.60 USD * 24 小時 * 31 天 = 29,462.40 USD

  • 隨需定價

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 Cohere 的 Command 模型將輸入文字的 6000 個字符輸入結果,總結為 2000 個字符的輸出結果。

    產生的總成本 = 6000 個字符/1,000 * 0.0015 USD + 2000 個字符/1,000 * 0.0020 USD = 0.013 USD

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 Cohere 的 Command - Light 模型將輸入文字的 6000 個字符輸入結果,總結為 2000 個字符的輸出結果。

    產生的總成本 = 6000 個字符/1000 * 0.0003 USD + 2000 個字符/1000 * 0.0006 USD = 0.003 USD

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 Cohere 的 Embed English 或 Embed Multilingual 模型產生 10,000 個字符輸入結果的嵌入。

    產生的總成本 = 10,000 個字符/1000 * 0.0001 USD = 0.001 USD

    自訂 (微調) 定價

    應用程式開發人員使用 1000 個資料字符自訂 Cohere Command 模型。訓練後,使用自訂模型佈建輸送量 1 小時來評估模型的效能。微調的模型會儲存 1 個月。評估後,開發人員會使用佈建輸送量 (1 個月使用期) 來託管自訂模型。

    微調每月產生的成本為:微調訓練 (0.004 USD * 1000) + 每月自訂模型儲存 (1.95 USD) + 1 小時自訂模型推論 (49.50 USD) = 55.45 USD

    自訂模型的佈建輸送量 (1 個月使用期) 產生的每月成本 = 39.60 USD

    佈建輸送量定價

    應用程式開發人員購買一個 Cohere Command 模型單元,且其文字摘要使用案例的期限為 1 個月。

    每月產生的總成本 = 1 個模型單元 * 39.60 USD * 24 小時 * 31 天 = 29,462.40 USD

  • 隨需定價

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 Meta 的 Llama 2 Chat (130 億) 模型將輸入文字的 2000 個字符輸入結果,總結為 500 個字符的輸出結果。

    產生的總成本 = 2000 個字符/1000 * 0.00075 USD + 500 個字符/1000 * 0.001 USD = 0.002 USD

    自訂 (微調) 定價

    應用程式開發人員使用 1000 個資料字符自訂 Llama 2 預先訓練 (700 億) 模型。訓練後,使用自訂模型佈建輸送量 1 小時來評估模型的效能。微調的模型會儲存 1 個月。評估後,開發人員會使用佈建輸送量 (1 個月使用期) 來託管自訂模型。

    微調每月產生的成本為:微調訓練 (0.00799 USD * 1000) + 每月自訂模型儲存 (1.95 USD) + 1 小時自訂模型推論 (23.50 USD) = 33.44 USD

    自訂模型的佈建輸送量 (1 個月使用期) 產生的每月成本 = 21.18 USD

    佈建輸送量定價

    應用程式開發人員購買一個 Meta Llama 2 模型單元,且其文字摘要使用案例的期限為 1 個月。

    每月產生的總成本為 1 個模型單元 * 21.18 USD * 24 小時 * 31 天 = 15,757.92 USD

  • 隨需定價

    應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫:要求 Mistral 7B 模型將輸入文字的 2000 個字符輸入結果,總結為 1000 個字符的輸出結果。

    每小時產生的總成本 = 2000 個字符/1000 * 0.00015 USD + 1000 個字符/1000 * 0.0002 USD = 0.0005 USD

    應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫:要求 Mixtral 8x7B 模型將輸入文字的 2000 個字符輸入結果,總結為 1000 個字符的輸出結果。

    每小時產生的總成本 = 2000 個字符/1000 * 0.00045 USD + 1000 個字符/1000 * 0.0007 USD = 0.0016 USD

    應用程式開發人員針對 Amazon Bedrock 每小時發出下列 API 呼叫:要求 Mistral 大型模型將輸入文字的 2000 個字符輸入結果,總結為 1000 個字符的輸出結果。 

    每小時產生的總成本 = 2000 個字符/1000 * 0.008 USD + 1000 個字符/1000 * 0.024 USD = 0.04 USD

  • 隨需定價

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 SDXL 模型產生 512 x 512 大小、步長為 70 的映像 (高品質)。

    產生的總成本 = 1 個映像 * 每個映像 0.036 USD = 0.036 USD

    應用程式開發人員針對 Amazon Bedrock 發出下列 API 呼叫:要求 SDXL 1.0 模型產生 1024 x 1024 大小、步長為 70 的映像 (高品質)。

    產生的總成本 = 1 個映像 * 每個映像 0.08 USD = 0.08 USD

    佈建輸送量定價

    應用程式開發人員購買一個 SDXL 1.0 模型單元,且使用期為 1 個月。

    產生的總成本 = 1 * 49.86 USD * 24 小時 * 31 天 = 37,095.84 USD

  • 模型評估範例 1︰

    隨需定價
    應用程式開發人員在美國東部 (維吉尼亞北部) AWS 區域使用 Anthropic Claude 2.1 和 Anthropic Claude Instant,提交資料集進行人工模型評估。

    資料集包含 50 個提示,開發人員需要 1 名工作者對每個提示回應集進行評分 (可在建立評估任務時設定為「每個提示的工作者」參數)。

    此評估任務中將有 50 項任務 (每位工作者每個提示回應組為 1 項任務)。50 個提示共計為 5000 個輸入字符,相關的回應共計 15000 個字符 (使用 Anthropic Claude Instant) 和 20000 個字符 (使用 Anthropic Claude 2.1)。

    此模型評估任務會產生下列費用:

    項目 輸入字符數 每 1,000 個輸入字符的定價 輸入成本 輸出字符數 每 1,000 個輸出字符的定價 輸出成本 人工任務數目 每項人工任務的價格 人工任務的成本 總計
    Claude Instant Inference 5000 0.0008 USD 0.004 USD 15,000 0.0024 USD 0.036 USD       0.04 USD
    Claude 2.1 Inference 5000 0.008 USD 0.04 USD 20,000 0.024 USD 0.48 USD       0.52 USD
    人工任務             50 0.21 USD 10.50 USD 10.50 USD
    總計                   11.06 USD

    模型評估範例 2︰

    隨需定價
    應用程式開發人員在美國東部 (維吉尼亞北部) AWS 區域使用 Anthropic Claude 2.1 和 Anthropic Claude Instant,提交資料集進行人工模型評估。

    資料集包含 50 個提示,開發人員需要 2 名工作者對每個提示回應集進行評分 (可在建立評估任務時設定為「每個提示的工作者」參數)。此評估任務中將有 100 項任務 (每位工作者每個提示回應組為 1 項任務:2 個工作者 x 50 個快速回應集 = 100 個人工任務)。

    50 個提示共計為 5000 個輸入字符,相關的回應共計 15000 個字符 (使用 Anthropic Claude Instant) 和 20000 個字符 (使用 Anthropic Claude 2.1)。

    此模型評估任務會產生下列費用:

    項目 輸入字符數 每 1,000 個輸入字符的定價 輸入成本 輸出字符數 每 1,000 個輸出字符的定價 輸出成本 人工任務數目 每項人工任務的價格 人工任務的成本 總計
    Claude Instant Inference 5000 0.0008 USD 0.0040 USD 15000 0.0024 USD 0.036 USD       0.04 USD
    Claude 2.1 Inference 5000 0.008 USD 0.0400 USD 20,000 0.024 USD 0.48 USD       0.52 USD
    人工任務             100 0.21 USD 21.00 USD 21.00 USD
    總計                   21.56 USD
  • 範例 1:客戶支援聊天機器人
    一名應用程式開發人員建立了一個客戶支援聊天機器人,並使用內容過濾器封鎖有害內容和拒絕主題,以過濾不想要的查詢和回應。

    聊天機器人每小時提供 1000 個用戶查詢。每個使用者查詢的平均輸入長度為 200 個字元,並接收 1500 個字元的 FM 回應。

    每個 200 個字元的使用者查詢對應於 1 個文字單元。

    每個 1500 個字元的 FM 回應對應於 2 個文字單元。

    每小時處理的文字單元 = (1 + 2) * 1000 個查詢 = 3000 個文字單元

    內容過濾器和拒絕主題每小時產生的總成本 = 3000 * (0.75 USD + 1.00 USD) /1000 = 5.25 USD

     

    範例 2:呼叫中心轉錄摘要
    一名應用程式開發人員建立了一個應用程式,以彙總使用者與客服人員之間的聊天記錄。它使用敏感信息過濾器編輯 10,000 個對話的生成摘要中的個人身分識別資訊 (PII)。

    每個生成的摘要平均有 3500 個字元,對應於 4 個文字單元。

    總結 10,000 次對話所產生的總成本 = 10000 * 4 * (0.1/1000 USD) = 4 USD

    項目 輸入字符數 每 1,000 個輸入字符的定價 輸入成本 輸出字符數 每 1,000 個輸出字符的定價 輸出成本 人工任務數目 每項人工任務的價格 人工任務的成本 總計
    Claude Instant Inference 5000 0.0008 USD 0.004 USD 15,000 0.0024 USD 0.036 USD       0.04 USD
    Claude 2.1 Inference 5000 0.008 USD 0.04 USD 20,000 0.024 USD 0.48 USD       0.52 USD
    人工任務             100 0.21 USD 21.00 USD 21.00 USD
    總計                   21.56 USD
  • 定價範例:應用程式開發人員匯入自訂的 Llama 3.1 類型模型,大小採用 8B 參數,在 us-east-1 區域的序列長度為 128K 並在 1 個月之後刪除模型。這需要 2 個自訂模型單元。因此,每分鐘價格將為 0.1570 USD,因為需要 2 個自訂模型單元。2 個自訂模型單元的模型儲存成本為每月 3.90 USD。

    匯入模型無需費用。第一次成功調用為上午 8:03,此時計量開始。5 分鐘計量時段為上午 8:03 至上午 8:07;上午 8:07 至上午 8:11 等。如果在任何 5 分鐘期間至少有一次調用,該時段將視為作用中進行計費。如果在上午 8:07 至上午 8:11 之間沒有調用,計量將於上午 8:11 停止。在這種情況下,如下所示計費:0.1570 USD * 5 分鐘 * 3 個五分鐘時段 = 2.355 USD

  • 範例:新聞摘要
    應用程式開發人員建立一項流程,為交易者自動化新聞摘要。該流程包括一個輸入節點,該節點採用 10 個 S3 位置的陣列,用於 10 個主要新聞社的文章 (1 次節點過渡)。然後使用反覆運算器節點來反覆運作 10 個位置,使用 S3 擷取節點從每個 S3 位置擷取檔案,並調用具有提示節點的模型來總結每個檔案 (+ 10 個檔案 x 3 次節點轉換)。然後使用收集器節點來收集所有結果,使用 S3 存儲節點將結果寫入 S3,然後在輸出節點中完成 (+ 3 次節點轉換)。每週每半個小時執行一次此流程。

    每個流程執行的節點轉換次數為:1 + 10*3 + 3 = 34 次節點轉換/流程執行

    每月流程執行次數為:24 小時 * 2* 5 天 * 4 週 = 960 次流程執行/月。

    每月帳單總額為:34* 960 * 0.035 USD/1000 USD = 1.14 USD

    其他費用
    該帳單還包括在工作流程執行中使用的 AWS 服務的額外費用,包括在擷取和儲存節點中的 Amazon S3 用量,以及提示節點中的 Amazon Bedrock 基礎模型用量。