Amazon Bedrock

  • モデルの料金
  • モデルの料金

    料金は、モダリティ、プロバイダー、モデルによって異なります。詳細な料金を確認するには、モデルプロバイダーを選択してください。

    Amazon Bedrock は、Standard、Flex、Priority、Reserved など、さまざまな階層をサポートしています。クリックすると、サービス階層の詳細をご覧いただけます

    Amazon Bedrock は、Anthropic、Meta、Mistral AI、Amazon などの主要な AI プロバイダーから提供される厳選した基盤モデル (FM) を、オンデマンド推論料金と比較して 50% 低い料金でバッチ推論用に提供しています。Batch の詳細については、こちらをクリックしてください。モデルのリストについては、こちらをご覧ください。 

    • AI21 Labs
    • AI21 Labs

      オンデマンド料金

    • Amazon
      • Amazon Nova
      • Amazon Nova

        モデルを理解するための料金

        グローバルクロスリージョン推論

        地理的クロスリージョン推論およびリージョン内

        組み込みツール

        クリエイティブコンテンツ生成モデルの料金

        音声理解および生成モデルの料金

        Speech to Speech 基盤モデルのオンデマンド料金

        注: *テキストトークンの入力および出力の料金は、音声からテキストへの文字起こし、タスクの完了や知識グラウンディングのためのツール呼び出し、セッションへの会話履歴の追加などの特定のユースケースに適用されます。 

        カスタム Nova モデルのオンデマンド推論の料金は、基本の Nova 推論と同じです。

        埋め込みモデルの料金

      • Amazon Titan
      • Amazon Titan

      • その他の Amazon
    • Anthropic
    • Anthropic

      オンデマンド料金とバッチ料金

      拡張アクセス付きモデル

      プロバイダー モデル名 リージョン 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金 100 万入力トークンあたりの料金 (バッチ) 100 万出力トークンあたりの料金 (バッチ) 100 万入力トークンあたりの料金 (キャッシュ書き込み) 100 万入力トークンあたりの料金 (キャッシュ読み取り)
       Anthropic  Claude 3.5 Sonnet (Public Extended Access、2025 年 12 月 1 日発効) 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (チューリッヒ)、欧州 (パリ) 6.00 USD 30.00 USD 3.00 USD 15.00 USD N/A 該当なし
      Anthropic  Claude 3.5 Sonnet v2 (Public Extended Access、2025 年 12 月 1 日発効) 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン) 6.00 USD 30.00 USD 3.00 USD 15.00 USD 7.50 USD 0.60 USD

      Reserved 階層の料金

      レイテンシー最適化推論

      プロビジョンドスループットの料金

      プロビジョンドスループット料金については、アカウントチームまでお問い合わせください。

    • Cohere
    • Cohere

      オンデマンド料金

      Cohere モデル 1,000 クエリあたりの料金**
      Rerank 3.5 2.00 USD
      ** 1 つのクエリに最大 100 個のドキュメントチャンクを含めることができるクエリの数に対して課金されます。クエリに 100 個を超えるドキュメントチャンクが含まれている場合は、複数のクエリとしてカウントされます。たとえば、リクエストに 350 のドキュメントが含まれている場合、4 つのクエリとして扱われます。各ドキュメントには最大 500 個のトークン (クエリとドキュメントの合計トークンを含む) しか含めることができず、トークンの長さが 512 トークンを超える場合は複数のドキュメントに分割されることに注意してください。

      モデルのカスタマイズ (微調整) の料金:

      *トレーニングされたトークンの総数 = トレーニングデータコーパス内のトークン数 x エポック数

      プロビジョンドスループットの料金

      Cohere モデル モデルごとの 1 時間あたりの価格 
      コミットメントなしで
      1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金

      6 か月契約の 1 モデルあたりの時間料金

      Cohere Command

      49.50 USD

      39.60 USD

      23.77 USD

      Cohere Command - Light 8.56 USD

      6.85 USD

      4.11 USD
      Embed 3 English 7.12 USD

      6.76 USD

      6.41 USD
      Embed 3 Multilingual 7.12 USD

      6.76 USD

      6.41 USD

      モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。 

    • DeepSeek
    • DeepSeek

      オンデマンド料金

      • Standard
      • リージョン: 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)

        DeepSeek モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        DeepSeek v3.2 0.62 USD 1.85 USD

        リージョン: アジアパシフィック (ムンバイ)、南米 (サンパウロ)、アジアパシフィック (ジャカルタ)、アジアパシフィック (東京)、欧州 (ストックホルム)

        DeepSeek モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        DeepSeek v3.2 0.74 USD 2.22 USD

        リージョン: アジアパシフィック (シドニー)

        DeepSeek モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        DeepSeek v3.1 0.5974 USD 1.7304 USD
        DeepSeek v3.2 0.6386 USD 1.9055 USD
      • 優先度
      • リージョン: アジアパシフィック (シドニー)

        DeepSeek モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        DeepSeek v3.1 1.0455 USD 3.0282 USD
      • Flex
      • リージョン: アジアパシフィック (シドニー)

        DeepSeek モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        DeepSeek v3.1 0.2987 USD 0.8652 USD
    • Google
    • Google

      オンデマンド料金

      リージョン: 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)

      Google モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Gemma 3 4B 0.04 USD 0.08 USD
      Gemma 3 12B 0.09 USD 0.29 USD
      Gemma 3 27B 0.23 USD 0.38 USD

      リージョン: アジアパシフィック (ムンバイ)、欧州 (アイルランド)、欧州 (ミラノ)

      Google モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Gemma 3 4B 0.05 USD 0.09 USD
      Gemma 3 12B 0.11 USD 0.34 USD
      Gemma 3 27B 0.27 USD 0.45 USD

      リージョン: 南米 (サンパウロ) およびアジアパシフィック (東京)

      Google モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Gemma 3 4B 0.05 USD 0.10 USD
      Gemma 3 12B 0.11 USD 0.35 USD
      Gemma 3 27B 0.28 USD 0.46 USD

      リージョン: 欧州 (ロンドン)

      Google モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Gemma 3 4B 0.06 USD 0.12 USD
      Gemma 3 12B 0.14 USD 0.45 USD
      Gemma 3 27B 0.36 USD 0.59 USD

      リージョン: アジアパシフィック (シドニー)

      Google モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Gemma 3 4B 0.0412 USD 0.0824 USD
      Gemma 3 12B 0.0927 USD 0.2987 USD
      Gemma 3 27B 0.2369 USD 0.3914 USD

      * Priority 階層の料金は、Standard 階層の料金より 75% 高くなります
      * Flex 階層の料金は、Standard 階層の料金より 50% 割引になります

    • Luma AI
    • オンデマンド料金

    • Meta
    • Meta

      Llama 4

      オンデマンド料金とバッチ料金

      Llama 3.3

      オンデマンド料金とバッチ料金

      Llama 3.2

      オンデマンド料金とバッチ料金

      モデルのカスタマイズ (ファインチューニング) の料金

      プロビジョンドスループットの料金

      Llama 3.1

      オンデマンド料金とバッチ料金

      モデルのカスタマイズ (微調整) の料金

      プロビジョンドスループットの料金

      Llama 3

      オンデマンド料金

      Llama 2

      オンデマンド料金

      リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

      Meta モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金

      Llama 2 Chat (13B)

      0.75 USD

      1.00 USD

      Llama 2 Chat (70B)

      1.95 USD

      2.56 USD

      モデルのカスタマイズ (ファインチューニング) の料金

      Meta モデル 100 万トークンのトレーニング料金 各カスタムモデル*の 1 か月あたりの保存料金 1 時間あたり 1 モデルユニットに対するカスタムモデルから推測する料金 (契約なしのプロビジョンドスループット料金)

      Llama 2 Pretrained (13B)

      1.49 USD

      1.95 USD

      23.50 USD

      Llama 2 Pretrained (70B)

      7.99 USD

      1.95 USD 23.50 USD

      *カスタムモデルストレージ = 1.95 USD

      プロビジョンドスループットの料金

      メタモデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金

      Llama 2 Pretrained と Chat (13B)

      21.18 USD

      13.08 USD

      Llama 2 Pretrained (70B)

      21.18 USD

      13.08 USD

      *Llama 2 Pretrained モデルは、カスタマイズ後にプロビジョニングされたスループットでのみ利用可能です。

      モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。

    • MiniMax AI
    • MiniMax AI

      オンデマンド料金

      リージョン: 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)

      Minimax モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Minimax M2 0.30 USD 1.20 USD
      Minimax M2.1 0.30 USD 1.20 USD

      リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

      Minimax モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Minimax M2.5 0.30 USD 1.20 USD

      リージョン: アジアパシフィック (ムンバイ)、欧州 (アイルランド)、欧州 (ミラノ)

      Minimax モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Minimax M2 0.35 USD 1.41 USD
      Minimax M2.1 0.36 USD 1.44 USD

      リージョン: 南米 (サンパウロ) およびアジアパシフィック (東京)

      Minimax モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Minimax M2 0.36 USD 1.45 USD
      Minimax M2.1 0.36 USD 1.44 USD

      リージョン: 欧州 (ロンドン)

      Minimax モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Minimax M2 0.47 USD 1.86 USD
      Minimax M2.1 0.47 USD 1.86 USD

      リージョン: 欧州 (フランクフルト)、欧州 (ストックホルム)、アジアパシフィック (ジャカルタ)

      Minimax モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Minimax M2.1 0.36 USD 1.44 USD

      リージョン: アジアパシフィック (シドニー)

      Minimax モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Minimax M2 0.3090 USD 1.2360 USD
      Minimax M2.1 0.3090 USD 1.2360 USD

      * Priority 階層の料金は、Standard 階層の料金より 75% 高くなります
      * Flex 階層の料金は、Standard 階層の料金より 50% 割引になります

    • Mistral AI
    • Mistral AI

      オンデマンド料金

      リージョン: 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)

      Mistral モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Devstral 2 135B 0.40 USD 2.00 USD
      Magistral Small 1.2
      0.50 USD 1.50 USD
      Voxtral Mini 1.0
      0.04 USD 0.04 USD
      Voxtral Small 1.0
      0.10 USD 0.30 USD
      Ministral 3B 3.0
      0.10 USD 0.10 USD
      Ministral 8B 3.0
      0.15 USD 0.15 USD
      Ministral 14B 3.0
      0.20 USD 0.20 USD
      Mistral Large 3 0.50 USD 1.50 USD

      リージョン: アジアパシフィック (ムンバイ)

      Mistral モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Devstral 2 135B 0.48 USD 2.40 USD
      Magistral Small 1.2
      0.59 USD 1.76 USD
      Voxtral Mini 1.0
      0.05 USD 0.05 USD
      Voxtral Small 1.0
      0.12 USD 0.35 USD
      Ministral 3B 3.0
      0.12 USD 0.12 USD
      Ministral 8B 3.0
      0.18 USD 0.18 USD
      Ministral 14B 3.0
      0.24 USD 0.24 USD
      Mistral Large 3 0.59 USD 1.76 USD

      リージョン: 南米 (サンパウロ) およびアジアパシフィック (東京)

      Mistral モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Devstral 2 135B 0.48 USD 2.40 USD
      Magistral Small 1.2
      0.61 USD 1.82 USD
      Voxtral Mini 1.0
      0.05 USD 0.05 USD
      Voxtral Small 1.0
      0.12 USD 0.36 USD
      Ministral 3B 3.0
      0.12 USD 0.12 USD
      Ministral 8B 3.0
      0.18 USD 0.18 USD
      Ministral 14B 3.0
      0.24 USD 0.24 USD
      Mistral Large 3 0.61 USD 1.82 USD

      リージョン: 欧州 (アイルランド) と欧州 (ミラノ)

      Mistral モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Devstral 2 135B 0.48 USD 2.40 USD
      Magistral Small 1.2
      0.59 USD 1.76 USD
      Voxtral Mini 1.0
      0.05 USD 0.05 USD
      Voxtral Small 1.0
      0.12 USD 0.35 USD
      Ministral 3B 3.0
      0.12 USD 0.12 USD
      Ministral 8B 3.0
      0.18 USD 0.18 USD
      Ministral 14B 3.0
      0.24 USD 0.24 USD

      リージョン: 欧州 (ロンドン)

      Mistral モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Devstral 2 135B 0.62 USD 3.10 USD
      Magistral Small 1.2
      0.78 USD 2.33 USD
      Voxtral Mini 1.0
      0.06 USD 0.06 USD
      Voxtral Small 1.0
      0.16 USD 0.47 USD
      Ministral 3B 3.0
      0.16 USD 0.16 USD
      Ministral 8B 3.0
      0.23 USD 0.23 USD
      Ministral 14B 3.0
      0.31 USD 0.31 USD

      リージョン: アジアパシフィック (シドニー)

      Mistral モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Devstral 2 135B 0.41 USD 2.06 USD
      Magistral Small 1.2
      0.5150 USD 1.5450 USD
      Voxtral Mini 1.0
      0.0412 USD 0.0412 USD
      Voxtral Small 1.0
      0.1030 USD 0.3090 USD
      Ministral 3B 3.0
      0.1030 USD 0.1030 USD
      Ministral 8B 3.0
      0.1545 USD 0.1545 USD
      Ministral 14B 3.0
      0.2060 USD 0.2060 USD
      Mistral Large 3 0.5150 USD 1.5450 USD

      リージョン: アジアパシフィック (ジャカルタ)、欧州 (フランクフルト)、欧州 (ストックホルム)

      Mistral モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Devstral 2 135B 0.48 USD 2.40 USD

      * Priority 階層の料金は、Standard 階層の料金より 75% 高くなります
      * Flex 階層の料金は、Standard 階層の料金より 50% 割引になります

    • Moonshot AI
    • Moonshot AI

      オンデマンド料金

      リージョン: 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)

      Kimi モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Kimi K2 Thinking 0.60 USD 2.50 USD
      Kimi K2.5 0.60 USD 3.00 USD

      リージョン: アジアパシフィック (ムンバイ)

      Kimi モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Kimi K2 Thinking 0.71 USD 2.94 USD
      Kimi K2.5 0.72 USD 3.60 USD

      リージョン: 南米 (サンパウロ) およびアジアパシフィック (東京)

      Kimi モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Kimi K2 Thinking 0.73 USD 3.03 USD
      Kimi K2.5 0.72 USD 3.60 USD

      リージョン: 欧州 (ストックホルム)、アジアパシフィック (ジャカルタ)

      Kimi モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Kimi K2.5 0.72 USD 3.60 USD

      リージョン: アジアパシフィック (シドニー)

      Kimi モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Kimi K2 Thinking 0.6180 USD 2.5750 USD
      Kimi K2.5 0.6180 USD 3.0900 USD

      * Priority 階層の料金は、Standard 階層の料金より 75% 高くなります
      * Flex 階層の料金は、Standard 階層の料金より 50% 割引になります

    • NVIDIA
    • NVIDIA

      オンデマンド料金

      リージョン: 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)

      NVIDIA モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      NVIDIA Nemotron Nano 2 0.06 USD 0.23 USD
      NVIDIA Nemotron Nano 2 VL 0.20 USD 0.60 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0.06 USD 0.24 USD

      リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

      NVIDIA モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      NVIDIA Nemotron 3 Super 120B A12B 0.15 USD 0.65 USD

      リージョン: アジアパシフィック (ムンバイ)、欧州 (アイルランド)、欧州 (ミラノ)

      NVIDIA モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      NVIDIA Nemotron Nano 2 0.07 USD 0.27 USD
      NVIDIA Nemotron Nano 2 VL 0.24 USD 0.71 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0.07 USD 0.28 USD

      リージョン: 南米 (サンパウロ) およびアジアパシフィック (東京)

      NVIDIA モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      NVIDIA Nemotron Nano 2 0.07 USD 0.28 USD
      NVIDIA Nemotron Nano 2 VL 0.24 USD 0.73 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0.07 USD 0.29 USD

      リージョン: 欧州 (ロンドン)

      NVIDIA モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      NVIDIA Nemotron Nano 2 0.09 USD 0.36 USD
      NVIDIA Nemotron Nano 2 VL 0.31 USD 0.93 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0.09 USD 0.37 USD

      リージョン: アジアパシフィック (シドニー)

      NVIDIA モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      NVIDIA Nemotron Nano 2 0.0618 USD 0.2369 USD
      NVIDIA Nemotron Nano 2 VL 0.2060 USD 0.6180 USD
      NVIDIA Nemotron 3 Nano 30B A3B 0.0618 USD 0.2472 USD

      * Priority 階層の料金は、Standard 階層の料金より 75% 高くなります
      * Flex 階層およびバッチ料金は、Standard 階層の料金より 50% 割引になります

    • OpenAI
    • OpenAI

      • gpt-oss-20b、120b
        • Standard
        • リージョン: アジアパシフィック (シドニー)

          OpenAI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
          gpt-oss-20b 0.0721 USD 0.3090 USD
          gpt-oss-120b 0.1545 USD 0.6180 USD
        • 優先度
        • リージョン: アジアパシフィック (シドニー)

          OpenAI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
          gpt-oss-20b 0.1262 USD 0.5408 USD
          gpt-oss-120b 0.2704 USD 1.0815 USD
        • Flex
        • リージョン: アジアパシフィック (シドニー)

          OpenAI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
          gpt-oss-20b 0.0361 USD 0.1545 USD
          gpt-oss-120b 0.0773 USD 0.3090 USD
        • バッチ
        • リージョン: アジアパシフィック (シドニー)

          OpenAI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
          gpt-oss-20b 0.0361 USD 0.1545 USD
          gpt-oss-120b 0.0773 USD 0.3090 USD
        • モデルのカスタマイズ
        • モデルのカスタマイズ

          強化ファインチューニングの料金

          Amazon Bedrock の強化学習によるファインチューニング機能を使用することで、深い機械学習の専門知識や大量のラベル付きデータがなくてもモデル精度を向上できます。Amazon Bedrock は強化学習によるファインチューニングのワークフローを自動化し、サンプルプロンプトを取り込み、モデルの応答を生成し、報酬関数を用いてスコア付けします。これらのプロンプト、応答、スコアは、反復的な RFT ワークフローを通じてモデルを訓練するために使用されます。 

          トレーニングワークフロー全体は時間単位の料金に基づいて請求されます。トレーニング完了後、お客様はチューニングされたモデルをオンデマンド推論にすぐに使用できます。オンデマンド推論オプションには、推論中に処理されたトークンの数に基づいて課金されるトークンベースの料金モデルが含まれます。

          リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

          OpenAI モデル トレーニング時間あたりの料金 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金 1 か月あたりのトレーニング済みモデルごとの保存料金
          gpt-oss-20b 80.00 USD 0.09 USD 0.39 USD 1.95 USD
      • gpt-oss-safeguard 20b、120b
      • オンデマンド料金

        リージョン: 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)

        OpenAI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GPT OSS Safeguard 20B 0.07 USD 0.20 USD
        GPT OSS Safeguard 120B 0.15 USD 0.60 USD

        リージョン: アジアパシフィック (ムンバイ)、南米 (サンパウロ) およびアジアパシフィック (東京)

        OpenAI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GPT OSS Safeguard 20B 0.08 USD 0.24 USD
        GPT OSS Safeguard 120B 0.18 USD 0.71 USD

        リージョン: 欧州 (アイルランド) と欧州 (ミラノ)

        OpenAI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GPT OSS Safeguard 20B 0.08 USD 0.23 USD
        GPT OSS Safeguard 120B 0.18 USD 0.70 USD

        リージョン: 欧州 (ロンドン)

        OpenAI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GPT OSS Safeguard 20B 0.11 USD 0.31 USD
        GPT OSS Safeguard 120B 0.23 USD 0.93 USD

        リージョン: アジアパシフィック (シドニー)

        OpenAI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GPT OSS Safeguard 20B 0.0721 USD 0.2060 USD
        GPT OSS Safeguard 120B 0.1545 USD 0.6180 USD

        * Priority 階層の料金は、Standard 階層の料金より 75% 高くなります
        * Flex 階層およびバッチ料金は、Standard 階層の料金より 50% 割引になります。

    • Qwen
    • Amazon Bedrock

      Qwen

      • Qwen3 Coder、32B、235B
        • Standard
        • リージョン: アジアパシフィック (シドニー)

          Qwen モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
          Qwen3 Coder 30B A3B 0.1545 USD 0.6180 USD
          Qwen3 32B 0.1545 USD 0.6180 USD
          Qwen3 235B A22B 2507 0.2266 USD 0.9064 USD
        • 優先度
        • リージョン: アジアパシフィック (シドニー)

          Qwen モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
          Qwen3 Coder 30B A3B 0.2704 USD 1.0815 USD
          Qwen3 32B 0.2704 USD 1.0815 USD
          Qwen3 235B A22B 2507 0.3966 USD 1.5862 USD
        • Flex
        • リージョン: アジアパシフィック (シドニー)

          Qwen モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
          Qwen3 Coder 30B A3B 0.0773 USD 0.3090 USD
          Qwen3 32B 0.0773 USD 0.3090 USD
          Qwen3 235B A22B 2507 0.1133 USD 0.4532 USD
        • バッチ
        • リージョン: アジアパシフィック (シドニー)

          Qwen モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
          Qwen3 Coder 30B A3B 0.0773 USD 0.3090 USD
          Qwen3 32B 0.0773 USD 0.3090 USD
          Qwen3 235B A22B 2507 0.1133 USD 0.4532 USD
        • モデルのカスタマイズ
        • モデルのカスタマイズ

          強化ファインチューニングの料金

          Amazon Bedrock の強化学習によるファインチューニング機能を使用することで、深い機械学習の専門知識や大量のラベル付きデータがなくてもモデル精度を向上できます。Amazon Bedrock は強化学習によるファインチューニングのワークフローを自動化し、サンプルプロンプトを取り込み、モデルの応答を生成し、報酬関数を用いてスコア付けします。これらのプロンプト、応答、スコアは、反復的な RFT ワークフローを通じてモデルを訓練するために使用されます。

          トレーニングワークフロー全体は時間単位の料金に基づいて請求されます。トレーニング完了後、お客様はチューニングされたモデルをオンデマンド推論にすぐに使用できます。オンデマンド推論オプションには、推論中に処理されたトークンの数に基づいて課金されるトークンベースの料金モデルが含まれます。

          リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

          Qwen モデル トレーニング時間あたりの料金 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金 1 か月あたりのトレーニング済みモデルごとの保存料金
          Qwen3 32B 80.00 USD 0.20 USD 0.78 USD 1.95 USD
      • Qwen 3 Next、VL、Coder Next
      • オンデマンド料金

        リージョン: 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)

        Qwen モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        Qwen3 Next 80B A3B 0.15 USD 1.20 USD
        Qwen3 VL 235B A22B 0.53 USD 2.66 USD
        Qwen3 Coder Next 0.50 USD 1.20 USD

        リージョン: アジアパシフィック (ムンバイ)、欧州 (アイルランド)、欧州 (ミラノ)

        Qwen モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        Qwen3 Next 80B A3B 0.18 USD 1.41 USD
        Qwen3 VL 235B A22B 0.62 USD 3.13 USD
        Qwen3 Coder Next 0.60 USD 1.44 USD

        リージョン: 南米 (サンパウロ) およびアジアパシフィック (東京)

        Qwen モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        Qwen3 Next 80B A3B 0.18 USD 1.45 USD
        Qwen3 VL 235B A22B 0.64 USD 3.22 USD
        Qwen3 Coder Next 0.60 USD 1.44 USD

        リージョン: 欧州 (ロンドン)

        Qwen モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        Qwen3 Next 80B A3B 0.23 USD 1.86 USD
        Qwen3 VL 235B A22B 0.82 USD 4.12 USD
        Qwen3 Coder Next 0.78 USD 1.86 USD

        リージョン: 欧州 (フランクフルト)、アジアパシフィック (ジャカルタ)

        Qwen モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        Qwen3 Coder Next 0.60 USD 1.44 USD

        リージョン: アジアパシフィック (シドニー)

        Qwen モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        Qwen3 Next 80B A3B 0.1545 USD 1.2360 USD
        Qwen3 VL 235B A22B 0.5459 USD 2.7398 USD
        Qwen3 Coder Next 0.5150 USD 1.2360 USD

        * Priority 階層の料金は、Standard 階層の料金より 75% 高くなります
        * Flex 階層およびバッチ料金は、Standard 階層の料金より 50% 割引になります。

    • Stability AI
    • Stability AI

      オンデマンド料金

      Stability AI が提供する、前世代の画像モデルは、ステップ数と画像解像度に応じて、画像ごとに料金設定されています。

       

      リージョン: オレゴン、バージニア北部、オハイオ

      Stability AI Image Services 各モデルの世代あたりの料金  
      Stable Image 背景を削除 0.07 USD  
      Stable Image オブジェクトを消去 0.07 USD  
      Stable Image 制御構造 0.07 USD  
      Stable Image スケッチを制御 0.07 USD  
      Stable Image スタイルガイド 0.07 USD  
      Stable Image 検索と置換 0.07 USD  
      Stable Image インペイント 0.07 USD  
      Stable Image 検索と色変更 0.07 USD  
      Stable Image スタイル転送 0.08 USD  
      Stable Image Conservative Upscale 0.40 USD  
      Stable Image Creative Upscale 0.60 USD  
      Stable Image Fast Upscale 0.03 USD  
      Stable Image Outpaint 0.06 USD  
    • TwelveLabs
    • TwelveLabs

      オンデマンド料金

      • グローバルクロスリージョン推論
      • 地理的およびリージョン内クロスリージョン推論
    • Writer
    • Writer

      オンデマンド料金

      Writer モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
      Palmyra X4 2.50 USD 10.00 USD
      Palmyra X5 0.60 USD 6.00 USD
    • Z AI
    • Amazon Bedrock

      Z AI

      • GLM 5
      • オンデマンド料金

        リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

        Z AI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GLM 5 1.00 USD 3.20 USD

        * Priority 階層の料金は、Standard 階層の料金より 75% 高くなります
        * Flex 階層およびバッチ料金は、Standard 階層の料金より 50% 割引になります。

      • GLM 4.7
      • オンデマンド料金

        リージョン: 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)

        Z AI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GLM 4.7 0.60 USD 2.20 USD

        リージョン: アジアパシフィック (ジャカルタ)、アジアパシフィック (ムンバイ)、アジアパシフィック (東京)、南米 (サンパウロ)、欧州 (ストックホルム)

        Z AI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GLM 4.7 0.72 USD 2.64 USD

        リージョン: アジアパシフィック (シドニー)

        Z AI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GLM 4.7 0.6180 USD 2.2660 USD

        * Priority 階層の料金は、Standard 階層の料金より 75% 高くなります
        * Flex 階層およびバッチ料金は、Standard 階層の料金より 50% 割引になります。

      • GLM 4.7 Flash
      • オンデマンド料金

        リージョン: 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)

        Z AI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GLM 4.7 Flash 0.07 USD 0.40 USD

        リージョン: アジアパシフィック (ジャカルタ)、アジアパシフィック (ムンバイ)、アジアパシフィック (東京)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ミラノ)、欧州 (ストックホルム)、南米 (サンパウロ)

        Z AI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GLM 4.7 Flash 0.08 USD 0.48 USD

        リージョン: 欧州 (ロンドン)

        Z AI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GLM 4.7 Flash 0.11 USD 0.62 USD

        リージョン: アジアパシフィック (シドニー)

        Z AI モデル 100 万入力トークンあたりの料金 100 万出力トークンあたりの料金
        GLM 4.7 Flash 0.0721 USD 0.4120 USD

        * Priority 階層の料金は、Standard 階層の料金より 75% 高くなります
        * Flex 階層およびバッチ料金は、Standard 階層の料金より 50% 割引になります。

    • カスタムモデルインポート
    • カスタムモデルインポート

      • Llama
      • リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

        カスタムモデルユニットのバージョン v1.0
        カスタムモデルユニットあたりの料金/分* 0.05718 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        リージョン: 欧州 (フランクフルト)

        カスタムモデルユニットのバージョン v1.0
        カスタムモデルユニットあたりの料金/分* 0.07144 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。

        *5 分単位で請求

      • マルチモーダル Llama
      • リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

        カスタムモデルユニットのバージョン v1.0
        カスタムモデルユニットあたりの料金/分* 0.05718 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        リージョン: 欧州 (フランクフルト)

        カスタムモデルユニットのバージョン v1.0
        カスタムモデルユニットあたりの料金/分* 0.07144 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。

        *5 分間のウィンドウで課金

      • Mistral
      • リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

        カスタムモデルユニットのバージョン v1.0
        カスタムモデルユニットあたりの料金/分* 0.05718 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        リージョン: 欧州 (フランクフルト)

        カスタムモデルユニットのバージョン v1.0
        カスタムモデルユニットあたりの料金/分* 0.07144 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。

        *5 分間のウィンドウで課金

      • Mixtral
      • リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

        カスタムモデルユニットのバージョン v1.0
        カスタムモデルユニットあたりの料金/分* 0.05718 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        リージョン: 欧州 (フランクフルト)

        カスタムモデルユニットのバージョン v1.0
        カスタムモデルユニットあたりの料金/分* 0.07144 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。

        *5 分間のウィンドウで課金

      • Flan
      • リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

        カスタムモデルユニットのバージョン v1.0
        カスタムモデルユニットあたりの料金/分* 0.05718 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        リージョン: 欧州 (フランクフルト)

        カスタムモデルユニットのバージョン v1.0
        カスタムモデルユニットあたりの料金/分* 0.07144 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。

        *5 分間のウィンドウで課金

        オンデマンド推論の料金:
        最初の呼び出しが成功した時点から、モデルコピーがアクティブである期間にわたって、5 分間のウィンドウごとに課金されます。モデルコピーごとの最大スループットと同時実行制限は、入力/出力トークンの組み合わせ、ハードウェアタイプ、モデルサイズ、アーキテクチャ、推論の最適化などの要因によって異なり、モデルのインポートワークフロー中に決定されます。

        Bedrock は、使用パターンに応じてモデルコピーの数を自動的にスケールします。5 分間にわたって呼び出しがない場合、Bedrock はゼロにスケールダウンし、モデルを呼び出すとスケールアップして元に戻します。スケールアップして元に戻す際に、モデルのサイズによってはコールドスタート期間 (数十秒) が発生する場合があります。推論ボリュームが 1 つのモデルコピーの同時実行制限を継続的に超える場合、Bedrock はモデルコピーの数もスケールアップします。注: デフォルトの最大数はインポートされたモデルごとにアカウントあたり 3 個のモデルコピーですが、これは Service Quotas を通じて引き上げることができます。

      • Qwen
      • リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

        カスタムモデルユニットのバージョン v1.0
        カスタムモデルユニットあたりの料金/分* 0.05718 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        リージョン: 欧州 (フランクフルト)

        カスタムモデルユニットのバージョン v1.0
        カスタムモデルユニットあたりの料金/分* 0.07144 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。

        *5 分間のウィンドウで課金

        オンデマンド推論の料金:
        最初の呼び出しが成功した時点から、モデルコピーがアクティブである期間にわたって、5 分間のウィンドウごとに課金されます。モデルコピーごとの最大スループットと同時実行制限は、入力/出力トークンの組み合わせ、ハードウェアタイプ、モデルサイズ、アーキテクチャ、推論の最適化などの要因によって異なり、モデルのインポートワークフロー中に決定されます。

        Bedrock は、使用パターンに応じてモデルコピーの数を自動的にスケールします。5 分間にわたって呼び出しがない場合、Bedrock はゼロにスケールダウンし、モデルを呼び出すとスケールアップして元に戻します。スケールアップして元に戻す際に、モデルのサイズによってはコールドスタート期間 (数十秒) が発生する場合があります。推論ボリュームが 1 つのモデルコピーの同時実行制限を継続的に超える場合、Bedrock はモデルコピーの数もスケールアップします。注: デフォルトの最大数はインポートされたモデルごとにアカウントあたり 3 個のモデルコピーですが、これは Service Quotas を通じて引き上げることができます。

      • OpenAI
      • リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

        カスタムモデルユニットのバージョン v2.0
        カスタムモデルユニットあたりの料金/分* 0.1433 USD
        カスタムモデルユニットあたりのストレージコスト/月 1.95 USD

        注: モデルをホストするために必要なカスタムモデルユニットは、モデルアーキテクチャ、モデルパラメータ数、コンテキストの長さなど、さまざまな要因によって異なります。必要なカスタムモデルユニットの正確な数は、インポート時に決定されます。ご参考までに、Llama 3.1 8B 128K モデルには 2 カスタムモデルユニットが必要であり、Llama 3.1 70B 128k モデルには 8 カスタムモデルユニットが必要です。

        *5 分間のウィンドウで課金

        オンデマンド推論の料金:
        最初の呼び出しが成功した時点から、モデルコピーがアクティブである期間にわたって、5 分間のウィンドウごとに課金されます。モデルコピーごとの最大スループットと同時実行制限は、入力/出力トークンの組み合わせ、ハードウェアタイプ、モデルサイズ、アーキテクチャ、推論の最適化などの要因によって異なり、モデルのインポートワークフロー中に決定されます。

        Bedrock は、使用パターンに応じてモデルコピーの数を自動的にスケールします。5 分間にわたって呼び出しがない場合、Bedrock はゼロにスケールダウンし、モデルを呼び出すとスケールアップして元に戻します。スケールアップして元に戻す際に、モデルのサイズによってはコールドスタート期間 (数十秒) が発生する場合があります。推論ボリュームが 1 つのモデルコピーの同時実行制限を継続的に超える場合、Bedrock はモデルコピーの数もスケールアップします。注: デフォルトの最大数はインポートされたモデルごとにアカウントあたり 3 個のモデルコピーですが、これは Service Quotas を通じて引き上げることができます。

  • ナレッジベース
  • 構造化データの取得 (SQL 生成)

    構造化データの取得は、SQL クエリを生成するリクエストごとに課金されます。生成された SQL クエリは、構造化データストアからデータを取得するために使用されます。

    Rerank モデル

    Rerank モデルは検索拡張生成 (RAG) アプリケーションにおける応答の関連性と精度を向上させるように設計されています。クエリごとに課金されます。

    **1 つのクエリに最大 100 個のドキュメントチャンクを含めることができるクエリの数に対して課金されます。クエリに 100 個を超えるドキュメントチャンクが含まれている場合は、複数のクエリとしてカウントされます。たとえば、リクエストに 350 のドキュメントが含まれている場合、4 つのクエリとして扱われます。各ドキュメントには最大 512 個のトークン (クエリとドキュメントの合計トークンを含む) しか含めることができず、トークンの長さが 512 トークンを超える場合は複数のドキュメントに分割されることに注意してください。クエリは検索ユニットと同等です。

  • ガードレールを設定
  • Amazon Bedrock のガードレール

    Amazon Bedrock ガードレールの料金は、ガードレールで使用されるフィルターによって発生する料金に基づいています。Standard ティアと Classic ティアの両方で料金は同じです。

    ガードレールフィルター*

    料金

    コンテンツフィルター (テキストコンテンツ) (Standard ティアと Classic ティアの両方向け)

    1,000 テキストユニットあたり 0.15 USD

    コンテンツフィルター (画像コンテンツ)

    処理された画像あたり 0.00075 USD

    拒否されたトピック (Standard ティアと Classic ティアの両方向け)

    1,000 テキストユニットあたり 0.15 USD

    機密情報フィルター 

    1,000 テキストユニットあたり 0.10 USD

    機密情報フィルター (正規表現) 

    無料

    ワードフィルター

    無料

    コンテキストグラウンディングチェック

    1,000 テキストユニットあたり 0.10 USD

    自動推論チェック

    1,000 テキストユニットあたり 0.17 USD/自動推論ポリシー

    オンデマンド料金

    * 各ガードレールフィルターはオプションであり、アプリケーションの要件に基づいて有効にできます。料金は、ガードレールで使用されているフィルターのタイプに基づいて発生します。例えば、ガードレールにコンテンツフィルターと拒否トピックが設定されている場合、これらの 2 つのフィルターについては料金が発生しますが、機密情報フィルターに関連して発生する料金はありません。

    : テキスト単位には最大 1,000 文字まで含めることができます。テキスト入力が 1,000 文字を超える場合、それぞれ 1,000 文字以下を含む複数のテキスト単位として処理されます。例えば、テキスト入力に 5,600 文字が含まれている場合、6 テキスト単位について課金されます。

    コンテキストグラウンディングチェックでは、参照ソースとクエリを使用して、モデルの回答がソースを根拠としており、クエリに関連しているかどうかを判断します。課金されるテキストユニットの合計数は、ソース、クエリ、およびモデル応答のすべての文字を組み合わせて計算されます。

  • モデル評価
  • モデル評価

    モデル評価では、選択したモデルからの推論について課金されます。自動生成されたアルゴリズムスコアは追加料金なしで提供されます。独自のワークストリームを持ち込むヒューマンベースの評価では、評価におけるモデル推論の料金と、完了したヒューマンタスクごとに 0.21 USD の料金がかかります。

    モデル評価で RAG 評価または LLM-as-a-judge を使用する場合、ジャッジモデルが使用するトークンは、オンデマンド標準階層料金に基づいて課金されます。ジャッジプロンプトはトークン使用料金の一部として課金され、公開ドキュメントで確認できます。また、Bedrock ナレッジベースでの RAG 評価には、Bedrock ナレッジベースの通常の利用料金もかかります。

    モデル

    1,000 入力トークンあたりの料金

    1,000 出力トークンあたりの料金

    ヒューマンタスクあたりの料金

     

    評価対象として選択されたモデル

    選択したモデルに基づく

    選択したモデルに基づく

     

    0.21 USD

     
  • データオートメーション
  • データオートメーション

    Amazon Bedrock のデータオートメーションは、インテリジェントドキュメント処理、動画分析、RAG などのユースケース向けに、非構造化マルチモーダルコンテンツを構造化データ形式に変換します。Bedrock のデータオートメーションは、動画のシーンごとの説明、音声文字起こし、自動ドキュメント分析など、モダリティ固有の事前定義済みのデフォルトを使用して、標準出力コンテンツを生成できます。お客様は、独自のデータスキーマに基づいてブループリントで出力要件を指定することでカスタム出力を追加で作成し、既存のデータベースまたはデータウェアハウスに簡単にロードできます。ナレッジベースとの統合により、Bedrock のデータオートメーションを使用して RAG アプリケーション用にコンテンツを解析することもできます。これにより、画像とテキストの両方に埋め込まれた情報を含めることで、結果の精度と関連性を高めることができます。

    Amazon Bedrock ナレッジベースでは、マルチモーダルデータのためにより適切で正確な回答を提供することを目的として、Bedrock データオートメーション統合を提供しています。ナレッジベースを設定する場合、解析方法として Bedrock データオートメーションを選択して、図、グラフ、図などの画像やドキュメントから意味のある洞察を分析および抽出できます。処理中、Bedrock データオートメーションは、取り込まれたドキュメントや画像から意味のある情報を抽出し、それを以降のナレッジベースのステップでチャンク化、埋め込み、保存に使用します。ナレッジベースと統合された Bedrock データオートメーションは、標準化された出力を提供し、それについて課金します。

  • インテリジェントプロンプトルーティング
  • プライスポイント 料金ディメンション 料金プラン
    インテリジェントプロンプトルーティング 1,000 件のリクエストあたり 1 USD オンデマンド

    インテリジェントプロンプトルーティング

    インテリジェントプロンプトルーティングを使用すると、質とコストを最適化するのに役立つよう、同じモデルファミリーの基盤モデル (FM) を組み合わせて使用できます。例えば、Anthropic の Claude モデルファミリーを使用すると、Amazon Bedrock はプロンプトの複雑さに応じて、Claude 3.5 Sonnet と Claude 3 Haiku の間でリクエストをインテリジェントにルーティングできます。同様に、Amazon Bedrock は Meta Llama 3.3 70B と 3.18B、Nova Pro と Nova Lite の間でリクエストをルーティングできます。プロンプトルーターは、応答の質とコストを最適化するのをサポートしながら、各リクエストについてどのモデルが最適なパフォーマンスを提供するかを予測します。これは、カスタマーサービスアシスタントなどのアプリケーションで特に役立ちます。このようなアプリケーションでは、単純なクエリはより小さく、より高速で、よりコスト効率の高いモデルで処理でき、複雑なクエリはより高性能なモデルにルーティングされます。インテリジェントプロンプトルーティングを使用すると、精度について妥協することなく、コストを最大 30% 削減できます。

  • プロンプト最適化
  • Amazon Bedrock のためのプロンプト最適化

    入力プロンプトと最適化されたプロンプトのトークン数に基づいて課金されます。

    すべての料金は、2025 年 4 月 23 日から毎月請求されます。 

    1,000 トークンあたりの料金
    0.030 USD

料金の例

  • アプリケーション開発者は Amazon Bedrock に対して次の API 呼び出しを行います: AI21 の Jurrasic-2 Mid モデルに対して、入力テキストの 10,000 トークンの入力を 2,000 トークンの出力にまとめるリクエスト。

    発生した合計コスト = 10K トークン/1,000 * 0.0125 USD + 2K トークン/1,000 * 0.0125 USD = 0.15 USD

  • オンデマンド料金

    アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Amazon Titan Text Lite モデルに対して、入力テキストの 1K トークンの入力を 2K トークンの出力にまとめるリクエスト。

    発生した 1 時間あたりの総コストは = 2 K トークン/1000 * 0.0003 USD + 1 K トークン/1000 * 0.0004 USD = 0.001 USD です。

    アプリケーションデベロッパーが Amazon Bedrock に対して次の API コールを行います。Amazon Titan Image Generator の基本モデルに、標準品質の 1,024 x 1,024 サイズのイメージを 1000 個生成するようにリクエストします。

    発生するコストの合計: 1000 画像 x 0.01 USD/画像 = 10 USD

    カスタマイズ (微調整と継続的な事前トレーニング) の価格設定

    アプリケーション開発者は、1000 組の画像とテキストを使用して Amazon Titan Image Generator モデルをカスタマイズします。トレーニング後、開発者はカスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。

    微調整にかかる月額費用は次のとおりです。微調整トレーニング (0.005 USD* 500* 64)。ここで、0.005 USD は表示される画像あたりの価格、500 USD はステップ数、64 はバッチサイズ + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (21 USD) = 160 USD + 1.95 USD + 21 = 182.95 USD

    プロビジョンドスループットの料金

    アプリケーション開発者は、テキスト要約のユースケースとして、Titan Text Express の 2 つのモデルユニットを 1 か月契約で購入します。

    発生する月間コストの合計: 2 モデルユニット x 18.40 USD/時間 x 24 時間 x 31 日間 = 27,379.20 USD

    アプリケーションデベロッパーは、Amazon Titan Image Generator の基本モデルのモデルユニットを 1 か月契約で 1 ユニット購入します。

    発生した合計コスト = 1 モデルユニット* 16.20 USD * 24 時間 * 31 日間 = 12,052.80 USD

  • 例 1: カスタマーサポートチャットボット
    アプリケーション開発者は、カスタマーサポートチャットボットを作成し、コンテンツフィルターを使用して有害なコンテンツや拒否されたトピックをブロックし、望ましくないクエリや応答をフィルタリングします。

    チャットボットは 1 時間あたり 1000 件のユーザークエリを処理します。各ユーザークエリの平均入力長は 200 文字で、1500 文字の FM 応答を受け取ります。

    200 文字の各ユーザークエリは 1 つのテキスト単位に対応します。

    1,500 文字の FM 応答は、それぞれ 2 つのテキスト単位に対応します。

    1 時間あたりに処理されるテキスト単位 = (1 + 2) * 1000 クエリ = 3000 テキスト単位

    コンテンツフィルタと拒否トピックの 1 時間あたりに発生する合計コスト = 3000 * (USD 0.15 + USD 0.15)/1000 = USD 0.90

     

    例 2: コールセンターのトランスクリプトの要約
    アプリケーション開発者は、ユーザーとサポートエージェント間のチャット記録を要約するアプリケーションを作成します。機密情報フィルターを使用して、生成された10,000件の会話の要約に含まれる個人を特定できる情報(PII)を編集します。

    生成された各要約は、4 つのテキスト単位に相当する平均3,500文字です。

    10,000 件の会話を要約するために発生した合計コスト = 10,000 * 4 * (0.1 USD/1,000) = 4 USD

     

    例 3: 医療プロトコル検証エンジン
    あるヘルスケアテクノロジー企業では、自社の臨床意思決定支援システムに自動推論チェックを導入して、治療法の提案を医療ガイドラインに照らし合わせて検証しています。

    このシステムは、1 か月あたり 5,000 件の症例を処理します。各ケースには以下が含まれます。

    • 患者データの概要: 500 文字 (1 テキスト単位)
    • 診断評価: 2,000 文字 (2 テキスト単位)
    • 推奨治療法: 4,500 文字 (5 テキスト単位)

    1 か月あたりに処理されるテキスト単位 = (1 + 2 + 5) 5,000 ケース = 40,000 テキスト単位
    自動推論チェックで 1 か月あたりに発生した合計コスト = 40,000 (0.17 USD)/1,000 = 6.80 USD

     

  • 料金例 1 (Amazon Rerank 1.0 モデルを使用したリランク)

    特定の月に、Amazon Rerank 1.0 モデルを使用して Rerank API に対して 200 万回のリクエストを行います。100 万件のリクエストに含まれるドキュメント数はそれぞれ 100 件未満であるため、1 回のリクエストに対して請求されます。 残りの 100 万件のリクエストには 120~150 件のドキュメントが含まれているため、1 回のリクエストにつき 2 件分の請求が発生します。

    1 回のリクエストの料金 = 0.001 USD
    合計料金 = 1,000,000* 0.001 USD + 1,000,000*2*0.001 USD = 3000 USD 

    料金例 2: (構造化データの取得)

    アプリケーション開発者が、Amazon Redshift に保存されている構造化データをクエリするサポートチャットボットを作成します。開発者は Bedrock ナレッジベースを作成し、Amazon Redshift に接続します。チャットボットは 1 時間あたり 10000 件のユーザークエリを処理します。ユーザークエリから SQL を生成する場合、ユーザークエリごとに GenerateQuery API あたり 0.002 USD の費用がかかります。

    1 時間あたり SQL を生成するために発生する合計コストは、0.002 USD*10000 = 20 USD です。
    その月に発生した合計コスト = 20*24*30 USD = 1,440 USD

  • オンデマンド料金

    アプリケーション開発者は、米国西部 (オレゴン) リージョンの Amazon Bedrock に対して次の API コールを行います: Anthropic の Claude モデルに対して、入力テキストの 11K トークンの入力を 4K トークンの出力にまとめるリクエスト。

    発生するコストの合計: 11,000 トークン/1000 x 0.008 USD + 4,000 トークン/1000 x 0.024 USD = 0.088 USD + 0.096 USD = 0.184 USD

    プロビジョンドスループットの料金

    あるアプリケーション開発者が米国西部 (オレゴン) リージョンで Anthropic Claude Instant のモデルユニットを1つ購入しました。

    1 か月あたりの発生した合計コスト = 1 モデルユニット * 39.60 USD * 24 時間 * 31 日間 = 29,462.40 USD

  • オンデマンド料金

    アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Cohere の Command モデルに対して、入力テキストの 6K トークンの入力を 2K トークンの出力にまとめるリクエスト。

    発生するコストの合計: 6,000 トークン/1000 * 0.0015 USD + 2,000 トークン/1000 *0.002 USD = 0.013 USD

    アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Cohere の Command-Light モデルに対して、入力テキストの 6K トークンの入力を 2K トークンの出力にまとめるリクエスト。

    発生するコストの合計 = 6K トークン/1000 * 0.0003 USD + 2K トークン/1000 * 0.0006 USD = 0.003 USD

    アプリケーション開発者は、Amazon Bedrock に次の API 呼び出しを行います: Cohere の Embed English モデルまたは多言語モデルに、10K トークンの入力に対して埋め込みを生成するようリクエストします。

    発生するコストの合計 = 10K トークン/1000 * 0.0001 USD = 0.001 USD

    モデルのカスタマイズ (微調整)

    アプリケーション開発者は、1000 トークンのデータを使用して Cohere コマンドモデルをカスタマイズします。トレーニング後、カスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。

    微調整にかかる月額費用は、微調整トレーニング (0.004 USD x 1000) + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (49.50 USD) = 55.45 USD

    カスタムモデルのプロビジョニングされたスループット (1 か月間のコミット) で発生する月額コスト = 39.60 USD

    プロビジョンドスループットの料金

    アプリケーションデベロッパーは、テキスト要約のユースケースとして、Cohere Command の 1 モデルユニットを 1 か月の契約で購入します。

    1 か月あたりの発生した合計コスト = 1 モデルユニット * 39.60 USD * 24 時間 * 31 日間 = 29,462.40 USD

  • 料金の例: アプリケーションデベロッパーは、サイズが 8B パラメータ、シーケンス長が 128K である、カスタマイズされた Llama 3.1 タイプのモデルを us-east-1 リージョンにインポートし、1 か月後にそのモデルを削除します。これには 2 つのカスタムモデルユニットが必要です。つまり、2 カスタムモデルユニットが必要であるため、1 分あたりの料金は 0.1570 USD となります。その月の 2 カスタムモデルユニットのモデルストレージコストは 3.90 USD となります。

    モデルのインポートには料金はかかりません。最初の呼び出しが成功したのは午前 8 時 3 分で、その時点で計測が開始されます。5 分間の計測ウィンドウは、午前 8 時 3 分~午前 8 時 7 分、午前 8 時 7 分~午前 8 時 11 分などです。ある 5 分間に少なくとも 1 回の呼び出しがあった場合、そのウィンドウはアクティブであるものとみなされ、課金されます。午前 8 時 3 分に呼び出しが実行され、午前 8 時 7 分を過ぎた後に呼び出しがない場合、メータリングは午前 8 時 7 分に停止します。この場合、請求額は次のように計算されます: 0.1570 USD * 5 分間 * 1 つの 5 分間のウィンドウ = 0.785 USD

  • 料金の例 1
    BDA カスタム出力を使用して 1,000 ページのドキュメントを処理するとします。1,000 ページすべてが 15 個のフィールドがあるブループリント 1 を使用して処理されます。フィールド数が 30 以下のブループリントの 1 ページあたりの料金は 0.040 USD です。合計コストは 40 USD となります。

    処理する総ページ = 1,000
    フィールド数が 30 未満のブループリントの 1 ページあたりの料金 = 0.040 USD
    合計料金 = 1,000 * 0.040 USD = 40 USD

     

    料金の例 2
    BDA カスタムアウトプットを使用して 2 つのドキュメントを処理するとします。ドキュメント 1 は 40 ページあり、20 個のフィールドがあるブループリント 1 を使用して処理されます。ドキュメント 2 は 10 ページあり、40 個のフィールドがあるブループリント 2 を使用して処理されます。ブループリント 1 の 1 ページあたりの料金は 0.040 USD です。これは、ブループリント 1 に含まれるフィールド数が 30 個以下であるためです。ブループリント 2 の 1 ページあたりの料金は 0.045 USD です。ブループリント 1 を使用したドキュメント 1 の処理コストは 1.60 USD です。ブループリント 2 を使用したドキュメント 2 の処理コストは 0.45 USD です。両方のドキュメントを処理するための合計コストは 2.05 USD になります。

    処理する総ページ = 50
    フィールド数が 30 未満のブループリント 1 の 1 ページあたりの料金 = 0.040 USD
    40 個のフィールドがあるブループリント 2 の 1 ページあたりの料金 = 0.040 USD + (30 を超える追加フィールドの数* 1 フィールドあたり 0.0005 USD)
    30 を超える追加フィールドの数 = 40 - 30 = 10
    フィールドが 40 個あるブループリント 2 の 1 ページあたりの料金 = 0.040 USD + (1 フィールドあたり 10 *0.0005 USD) = 0.045 USD
    ブループリント 1 を使用したドキュメント 1 の料金 = 40 ページ x 1 ページあたり 0.040 USD = 1.6 USD
    ブループリント 2 を使用したドキュメント 2 の料金 = 10 ページ x 1 ページあたり 0.045 USD = 0.45 USD
    合計料金 = ドキュメント 1 の料金 + ドキュメント 2 の料金 = 1.6 USD + 0.45 USD = 2.05 USD

     

    料金の例 3:
    Bedrock データオートメーションをパーサーとして使用するように Bedrock ナレッジベースを設定し、1,000 ページのドキュメントを取り込むとします。コスト構造はナレッジベースの解析オプションによって異なることに注意してください。BDA はページ単位の料金を使用しますが、基盤モデルパーサーは入力トークンと出力トークンに基づいて課金します。コンテキストとして、1,000 ページ (30% が表、30% が図) を処理する場合、通常 2,900 個の入力トークンと 750 個の出力トークンが必要です。トークンの消費量はコンテンツの種類によって異なるため、より正確な見積もりを得るには、お客様独自のデータを使用してテストすることをお勧めします。Bedrock ナレッジベースと Bedrock データオートメーションの統合では、1 ページあたりの料金が 0.010 USD である標準出力が使用されることに注意してください。合計コストは 10 USD となります。

    処理する総ページ = 1,000
    標準出力の 1 ページあたりの料金 = USD 0.010
    合計料金 = 1,000 × 0.010 USD = 10 USD

     

    料金の例 4:
    BDA 標準出力を使用して 60 分の動画を処理するとします。ビデオ標準出力の 1 分あたりの料金は 0.050 USD です。合計コストは 3.00 USD となります。

    合計処理時間 = 60
    ビデオ標準出力の 1 分あたりの料金 = 0.050 USD
    合計料金 = 60 × 0.050 USD = 3.00 USD

     

    料金の例 5:
    BDA カスタム出力を使用して 2,000 枚の画像を処理するとします。最初の 1,000 枚の画像は、10 個のフィールドがあるブループリント 1 を使用して処理されます。最後の 1,000 ページは、40 個のフィールドがあるブループリント 2 を使用して処理されます。ブループリント 1 の画像あたりの料金は 0.005 USD です。これは、ブループリント 1 に含まれるフィールドが 30 個以下であるためです。ブループリント 2 のイメージあたりの料金は 0.01 USD です。ブループリント 1 を使用した最初の 1,000 枚の画像の処理コストは 5.00 USD です。ブループリント 2 を使用した 2 番目の 1,000 枚の画像の処理コストは 10.00 USD です。2,000 枚の画像すべてを処理する場合の合計コストは 15.00 USD です。

    最初の 1000 枚の画像のコスト = 1,000 枚の画像 x 1 画像あたり 0.005 USD = 5.00 USD
    2 つ目の 1,000 枚の画像のコスト = 1,000 枚の画像* (0.005 USD + (30 を超える追加フィールドの数* 1 フィールドあたり 0.0005 USD))
    = 1,000* (0.005 USD + ((40-30) *0.0005 USD))
    = 1,000* (0.005 USD + (10*0.0005 USD)) = 10.00USD
    合計コスト = 5.00 USD + 10.00 USD = 15.00 USD

     

    料金の例 6:
    Bedrock データオートメーション標準出力を使用して、組織内の 15,000 分間の会議の音声録音を処理するとします。15,000 分すべての音声処理にかかる合計コストは 90 USD です。

    合計処理時間 = 15,000 分
    合計料金 = 15,000 分 × 0.006 USD = 90 USD

     

  • オンデマンド料金

    アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークン (推論トークンを含む) の出力に要約する、DeepSeek-R1 モデルに対するリクエスト:

    1 時間あたりの発生した合計コスト = 2K トークン/1,000 * 0.00135 USD + 1K トークン/1,000 * 0.0054 USD = 0.0081 USD

  • 例: ニュースの要約
    アプリケーションデベロッパーが、トレーダー向けのニュースの要約を自動化するフローを作成するとします。このフローには、S3 ロケーションを取得する Input ノードと、S3 内の 10 の主要通信社からの記事を含む 10 個のファイルを取得する S3 取得ノードが含まれます (2 ノード遷移)。次に、イテレータノードを使用してモデルを呼び出し、プロンプトノードで各ファイル (+ 10 ファイル x 2 ノード遷移) を要約します。次に、コレクターノードを使用してすべての結果を収集し、S3 ストレージノードを使用して結果を S3 に書き込み、出力ノードで完了します (+ 3 ノード遷移)。このフローは毎平日 30 分おきに実行されます。

    フロー実行ごとのノード遷移の数: 2+1+10*2 + 3 = 25 ノード遷移/フロー実行

    1 か月あたりのフロー実行回数: 24 時間 * 2 * 5 日 * 4 週間 = 960 フロー実行/月。

    毎月の請求額合計: 25 * 960 * 0.035 USD/1000 = 0.84 USD

    追加料金
    この請求には、検索ノードとストレージノードでの Amazon S3 の使用量や、プロンプトノードでの Amazon Bedrock 基盤モデルの使用など、ワークフローの実行で利用される AWS サービスの追加料金も含まれます。

  • オンデマンド料金

    アプリケーションデベロッパーは、Amazon Bedrock に対して次の API コールを行います: Meta の Llama 2 Chat (13 B) モデルに対して、入力テキストの 2K トークンの入力を 500 トークンの出力にまとめるリクエスト。

    発生するコストの合計 = 2K トークン / 1,000 * 0.00075 USD + 500 トークン / 1,000 * 0.001 USD = 0.002 USD

    モデルのカスタマイズ (微調整)

    アプリケーションデベロッパーは、1000 トークンのデータを使用して Llama 2 Pretrained (70B) モデルをカスタマイズします。トレーニング後、カスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。

    微調整にかかる月額費用は、微調整トレーニング (0.00799 USD x 1000) + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (23.50 USD) = 33.44 USD

    カスタムモデルのプロビジョニングされたスループット (1 か月間のコミット) で発生する月額コスト = 21.18 USD

    プロビジョンドスループットの料金

    アプリケーションデベロッパーは、テキスト要約のユースケースとして、Meta Llama 2 の 1 モデルユニットを 1 か月の契約で購入します。

    1 か月あたりの発生した合計コスト = 1 モデルユニット * 21.18 USD * 24 時間 * 31 日間 = 15,757.92 USD

  • オンデマンド料金

    アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークンの出力に要約する、Mistral 7B モデルに対するリクエスト。

    発生する時間単位の合計コスト = 2K トークン/1,000 * 0.00015 USD + 1K トークン/1,000 * 0.0002 USD = 0.0005 USD

    アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークンの出力に要約する、Mixtral 8x7B モデルに対するリクエスト。

    発生する時間単位の合計コスト = 2K トークン/1,000 * 0.00045 USD + 1K トークン/1,000 * 0.0007 USD = 0.0016 USD

    アプリケーションデベロッパーは、時間単位で、Amazon Bedrock に対して次の API コールを実行します: 入力テキストの 2K トークンの入力を 1K トークンの出力に要約する、Mistral Large モデルに対するリクエスト。 

    1 時間あたりの発生した合計コスト = 2K トークン/1,000 * 0.008 USD + 1K トークン/1,000 * 0.024 USD = 0.04 USD

  • モデル評価の例 1:

    オンデマンド料金
    あるアプリケーション開発者が、米国東部 (バージニア北部) の AWS リージョンで Anthropic Claude 2.1 と Anthropic Claude Instant を使用して、人間ベースのモデル評価用のデータセットを提出します。

    データセットには50のプロンプトが含まれており、開発者は各プロンプト-レスポンスセットの評価に1人のワーカーを必要とする(評価ジョブの作成時に「プロンプトごとのワーカー」パラメータとして設定可能)。

    この評価ジョブには 50 個のタスクが含まれます (各ワーカーごとにプロンプト/レスポンスのペアごとに 1 つのタスク)。50 個のプロンプトが組み合わされて 5000 個の入力トークンになり、関連する応答が Anthropic Claude Instant の場合は 15000 トークン、Anthropic Claude 2.1 の場合は 20,000 トークンになります。

    このモデル評価ジョブには次の料金が発生します:

    項目 入力トークンの数 1,000 入力トークンあたりの料金 入力のコスト 出力トークンの数 1,000 出力トークンあたりの料金 出力のコスト ヒューマンタスクの数 ヒューマンタスクあたりのコスト ヒューマンタスクのコスト 合計
    クロード・インスタント推論 5,000 0.0008 USD 0.004 USD 15000 0.0024 USD 0.036 USD       0.04 USD
    クロード 2.1 推論 5,000 0.008 USD 0.04 USD 20,000 0.024 USD 0.48 USD       0.52 USD
    ヒューマンタスク             50 0.21 USD 10.50 USD 10.50 USD
    合計                   11.06 USD

    モデル評価例 2

    オンデマンド料金
    あるアプリケーション開発者が、米国東部 (バージニア北部) の AWS リージョンで Anthropic Claude 2.1 と Anthropic Claude Instant を使用して、人間ベースのモデル評価用のデータセットを提出します。

    データセットには 50 個のプロンプトが含まれており、開発者は各プロンプト/応答セットを評価するために 2 人のワーカーを必要とします (評価ジョブの作成で「プロンプトあたりのワーカー数」パラメーターとして設定可能)。この評価ジョブには 100 個のタスクが含まれます (各ワーカーごとにプロンプト/レスポンスのペアごとに 1 つのタスク:2 人の作業者 x 50 個のプロンプト応答セット = 100 個のヒューマンタスク)。

    50 個のプロンプトが組み合わされて 5000 個の入力トークンになり、関連する応答が Anthropic Claude Instant の場合は 15000 トークン、Anthropic Claude 2.1 の場合は 20,000 トークンになります。

    このモデル評価ジョブには次の料金が発生します:

    項目 入力トークンの数 1,000 入力トークンあたりの料金 入力のコスト 出力トークンの数 1,000 出力トークンあたりの料金 出力のコスト ヒューマンタスクの数 ヒューマンタスクあたりのコスト ヒューマンタスクのコスト 合計
    クロード・インスタント推論 5,000 0.0008 USD 0.0040 USD 15000 0.0024 USD 0.036 USD       0.04 USD
    クロード 2.1 推論 5,000 0.008 USD 0.0400 USD 20,000 0.024 USD 0.48 USD       0.52 USD
    ヒューマンタスク             100 0.21 USD 21.00 USD 21.00 USD
    合計                   21.56 USD
  • 例: ニュースの要約
    アプリケーションデベロッパーは、Claude 3.5 を使用してトレーダーのためにニュースを要約するプロンプトを作成します。元のプロンプトは 429 トークンです。最適化されたプロンプトは 511 トークンで、FM がより簡潔な回答を生成できるようにより具体的な指示と例が含まれています。このデベロッパーは、511 トークンの最適化されたプロンプトをプロンプトオプティマイザーの入力として使用し、Claude 3.7 と Nova Pro 向けに 582 トークンと 579 トークンの 2 つの新しいバリアントを作成します。

    プロンプト最適化の入力トークンと出力トークンの合計数: 429 + 511 + 511 + 582 + 511 + 579 = 3,123

    1 か月あたりの合計請求額: 3,123 / 1,000 * 0.03 USD = 0.09 USD

  • オンデマンド料金

    アプリケーション開発者は Amazon Bedrock に対して次の API 呼び出しを行います: SDXL モデルに対して、ステップサイズ 70 (高画質) の 512 x 512 の画像を生成するリクエスト。

    発生するコストの合計: 1 画像 x 0.036 USD/画像 = 0.036 USD

    アプリケーション開発者は Amazon Bedrock に対して次の API コールを行います: SDXL 1.0 モデルに対して、ステップサイズ 70 (高画質) の 1024 x 1024 の画像を生成するリクエスト。

    発生するコストの合計: 1 画像 x 0.08 USD/画像 = 0.08 USD

    プロビジョンドスループットの料金

    アプリケーション開発者は、SDXL1.0の 1 つのモデルユニットを 1 か月契約で購入します。

    発生した合計コスト = 1 * 49.86 USD * 24 時間 * 31 日間 = 37,095.84 USD

  • オンデマンド料金

    アプリケーションデベロッパーは Amazon Bedrock に対して次の API コールを実行します: Pegasus 1.2 モデルに対して、10 秒の長さの動画に伴うことを説明するリクエスト (それにより 2,000 トークンの出力が提供される)。

    発生した合計コスト = 10 秒 * 0.00049 USD + 2K トークン/1000 * 0.0075 USD = 0.0199 USD


    アプリケーションデベロッパーは Amazon Bedrock に対して次の API コールを実行します: Marengo Embed [3.0 または 2.7] モデルに対して、合計 100 分となる 10 本の動画を埋め込むリクエスト。

    発生した合計コスト = 100 分 (6,000 秒) * 0.00070 USD = 4.2 USD


    アプリケーションデベロッパーは Amazon Bedrock に対して次の API コールを実行します: Marengo Embed 3.0 モデルに対して、テキストと画像を一緒に提供し、上記の例を使用して作成したであろう埋め込みリポジトリ全体で、指定された画像にバッグが表示されているクリップを検索するための埋め込みを生成するリクエスト。 

    発生した合計コスト = テキストリクエスト 1 件 * 0.00007 USD + 画像リクエスト 1 件 * 0.0001 USD = 0.00017 USD


    アプリケーションデベロッパーは Amazon Bedrock に対して次の API コールを実行します。Marengo Embed [3.0 または 2.7] モデルに対して、埋め込みを生成するテキストを提供することで、上記の例を使用して作成した埋め込みリポジトリから一致するクリップを検索するリクエスト。 

    発生した合計コスト = テキストリクエスト 1 件 * 0.00007 USD = 0.00007 USD

  • アプリケーションデベロッパーは Amazon Bedrock に対して次の API コールを実行します: Writer の Palmyra X5 モデルに対して、入力テキストの 10,000 トークンの入力を 2,000 トークンの出力にまとめるリクエスト。

    発生した合計コスト = 10K トークン/1,000 * 0.003 USD + 2K トークン/1,000 * 0.015 USD = 0.06 USD