Amazon Bedrock の料金

料金設定の概要

Amazon Bedrockは完全マネージド型サービスで、単一の API で高性能な基盤モデル (FM) を選択できるほか、セキュリティ、プライバシー、責任ある AI により開発を簡素化する生成 AI アプリケーションの構築に必要な幅広い機能を備えています。

Amazon Bedrock では、モデルの推論とカスタマイズに料金がかかります。推論については、次の 2 つの消費プランから選択できます。1/ オンデマンド: このモードでは、時間ベースの契約を行うことなく、従量課金制で FM を使用できます。2/ プロビジョンドスループット: このモードでは、時間ベースの契約で、アプリケーションのパフォーマンス要件を満たす十分なスループットをプロビジョニングできます。

料金モデル

オンデマンド

オンデマンドモードでは、使用した分のみのお支払いとなり、時間ベースの契約はありません。テキスト生成モデルでは、入力トークンの処理および出力トークンの生成ごとに課金されます。埋め込みモデルでは、入力トークンの処理ごとに課金されます。トークンは数文字で構成されており、ユーザー入力と、結果を生成するためのプロンプトを理解するためにモデルが学習する基本単位です。画像生成モデルでは、画像の生成ごとに課金されます。

Batch

バッチモードでは、一連のプロンプトを単一の入力ファイルとして提供し、応答を単一の出力ファイルとして受け取ることができるため、大規模な予測を同時に取得できます。レスポンスは処理され、Amazon S3 バケットに保存されるため、後でアクセスできます。バッチモードの料金は、オンデマンドモードの料金と同じです。

プロビジョンドスループット

Provisioned スループットモードでは、特定のベースモデルまたはカスタムモデルのモデルユニットを購入できます。プロビジョンドスループットモードは、主に、スループットの保証を必要とする大規模で一貫性のある推論ワークロード向けに設計されています。カスタムモデルには、プロビジョンドスループットを使用してのみアクセスできます。モデルユニットは、1 分あたりに処理される入力トークンまたは出力トークンの最大数によって測定される特定のスループットを提供します。時間単位で課金されるこのプロビジョンドスループット料金設定では、1 か月または 6 か月の契約期間を柔軟に選択できます。

モデルのカスタマイズ

Amazon Bedrock を使用すると、データを使用して FM をカスタマイズし、特定のタスクやビジネスコンテキストに合わせてカスタマイズされた応答を提供できます。ラベル付けされたデータを使用してモデルを微調整することも、ラベル付けされていないデータで継続的な事前トレーニングを行うこともできます。テキスト生成モデルのカスタマイズでは、モデルが処理したトークンの数 (トレーニングデータコーパス内のトークン数 x エポック数) に基づいてモデルトレーニング費用が課金されます。また、モデルのストレージはモデルごとに毎月課金されます。エポックとは、微調整プロセス中にトレーニングデータセットを 1 回完全に通過することを指します。カスタマイズされたモデルを使用した推論は、プロビジョニングされたスループットプランに基づいて課金され、プロビジョニングされたスループットを購入する必要があります。カスタマイズされたモデルでは、1 つのモデルユニットが契約期間なしで、推論に使用できます。この単一モデルユニットがカスタムモデルの推論に使用した時間数に対して課金されます。スループットを 1 つのモデルユニット以上に増やしたい場合は、1 か月または 6 か月の契約期間プランを購入する必要があります。

追加料金なしで構築できるパワフルなツール

Amazon BedrockのエージェントとAmazon Bedrockのナレッジベースを使用する場合、これらの機能で使用したモデルとベクトルデータベースに対してのみ課金されます。

料金の内訳

料金は、モダリティ、プロバイダー、モデルによって異なります。詳細な料金を確認するには、モデルプロバイダーを選択してください。

AI21 Labs

オンデマンド価格と一括価格設定

AI21 Labs モデル 入力トークン 1,000 個あたりの価格 出力トークン 1,000 個あたりの価格

Jurassic-2 Mid

0.0125 USD

0.0125 USD

Jurassic-2 Ultra

0.0188 USD

0.0188 USD

現在、モデルのカスタマイズ (微調整) とプロビジョンドスループットは、Amazon Bedrock の AI21 Labs モデルではサポートされていません。

Amazon

Anthropic

オンデマンド価格と一括価格設定

米国東部 (バージニア北部) と米国西部 (オレゴン)

Anthropic モデル 入力トークン 1,000 個あたりの価格 出力トークン 1,000 個あたりの価格

Claude Instant

0.00080 USD

0.00240 USD

Claude

0.00800 USD

0.02400 USD

親リージョン: アジアパシフィック (東京)

Anthropic モデル 入力トークン 1,000 個あたりの価格 出力トークン 1,000 個あたりの価格

Claude Instant

0.00223 USD

0.00755 USD

Claude

0.00800 USD

0.02400 USD

AWS リージョン: 欧州 (フランクフルト)

Anthropic モデル 入力トークン 1,000 個あたりの価格 出力トークン 1,000 個あたりの価格

Claude Instant

0.00248 USD

0.00838 USD

Claude

0.00800 USD

0.02400 USD

プロビジョンドスループットの料金:

米国東部 (バージニア北部) と米国西部 (オレゴン)

Anthropic モデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金

Claude Instant

39.60 USD

22.00 USD

Claude

63.00 USD

35.00 USD

親リージョン: アジアパシフィック (東京)

Anthropic モデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金

Claude Instant

53.10 USD

29.50 USD

Claude

163.80 USD

91.00 USD

AWS リージョン: 欧州 (フランクフルト)

Anthropic モデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金

Claude Instant

58.86 USD

32.70 USD

Claude

149.40 USD

83.00 USD

モデルユニットの詳細については、AWS アカウントチームにお問い合わせください。 

Cohere

オンデマンド価格と一括価格設定

Cohere モデル 入力トークン 1,000 個あたりの価格 出力トークン 1,000 個あたりの価格
Command 0.0015 USD 0.0020 USD
コマンドライト 0.0003 USD 0.0006 USD
埋め込み — 英語 0.0001 USD 該当なし
埋め込み — 多言語 0.0001 USD 該当なし

モデルのカスタマイズ (微調整) の料金:

Cohere モデル 1000 個のトークンをトレーニングする場合の料金* 各カスタムモデルの 1 か月あたりの保存料金 1 時間あたり 1 モデルユニットに対するカスタムモデルから推測する料金 (契約なしのプロビジョンドスループット料金)

Cohere Command

0.004 USD

1.95 USD

49.50 USD

Cohere Command と Light 0.001 USD

1.95 USD

8.56 USD

*トレーニングされたトークンの総数 = トレーニングデータコーパス内のトークン数 x エポック数

プロビジョンドスループットの料金:

Cohere モデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金

6 か月契約の 1 モデルあたりの時間料金

Cohere Command

39.60 USD

23.77 USD

Cohere Command と Light

6.85 USD

4.11 USD

モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。 

メタ Llama 2

オンデマンド価格と一括価格設定 

メタモデル 入力トークン 1,000 個あたりの価格 出力トークン 1,000 個あたりの価格

Llama 2 チャット (13B)

0.00075 USD

0.00100 USD

Llama 2 チャット (13B)

0.00195 USD

0.00256 USD

モデルのカスタマイズ (微調整) の料金:

メタモデル 1000 個のトークンをトレーニングする場合の料金* 各カスタムモデルの 1 か月あたりの保存料金 1 時間あたり 1 モデルユニットに対するカスタムモデルから推測する料金 (契約なしのプロビジョンドスループット料金)

Llama 2 の事前トレーニング済み (13B)

0.00149 USD

1.95 USD

23.50 USD

Llama 2 の事前トレーニング済み (70B)

0.00799 USD

1.95 USD 23.50 USD

*カスタムモデルストレージ = 1.95 USD

プロビジョンドスループットの料金:

メタモデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金 6 か月契約の 1 モデルあたりの時間料金

Llama 2 の事前トレーニング済みとチャット (13B)

21.18 USD

13.08 USD

Llama 2 の事前トレーニング済み (70B)

21.18 USD

13.08 USD

*Llama 2 の事前トレーニング済みモデルは、カスタマイズ後にプロビジョニングされたスループットでのみ利用可能です。

モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。

Stability AI

オンデマンド価格と一括価格設定

Stability が提供する画像モデルは、ステップ数と画像解像度に応じて、画像ごとに課金されます:

Stability AI モデル 画像解像度 標準画質 (50ステップ以下) で生成された画像1枚あたりの価格 高品質で生成された画像1枚あたりの価格 (50ステップ以上)

 

SDXL 0.8

512 x 512 インチまたはそれより小さいサイズ

画像あたり 0.018 USD

画像あたり 0.036 USD

512 x 512 よりも大きい

画像あたり 0.036 USD

画像あたり 0.072 USD

SDXL 1.0

1024 x 1024 まで

0.04 USD 0.08 USD

プロビジョンドスループットの料金:

Stability AI モデル 1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金* 6 か月契約の 1 モデルあたりの時間料金*

SDXL 1.0

49.86 USD

46.18 USD

*ベースモデルとカスタムモデルの推論を含みます。

モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。

現在、モデルのカスタマイズ (微調整) は、Amazon Bedrock の Stability AI モデルではサポートされていません。

料金の例

アプリケーション開発者は Amazon Bedrock に対して次の API 呼び出しを行います: AI21 の Jurrasic-2 Mid モデルに対して、入力テキストの 10,000 トークンの入力を 2,000 トークンの出力にまとめるリクエスト。

発生するコストの合計: 10,000 トークン/1000 x 0.0125 USD + 2,000 トークン/1000 x 0.0125 USD = 0.15 USD

オンデマンド料金

アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Amazon Titan Text – Lite モデルに対して、入力テキストの 8K トークンの入力を 2K トークンの出力にまとめるリクエスト。

発生した 1 時間あたりの総コストは = 2 K トークン/1000 * 0.0003 USD + 1 K トークン/1000 * 0.0004 USD = 0.001 USD です。

アプリケーション開発者が Amazon Bedrock に対して次の API コールを行います。Titan イメージジェネレーターの基本モデルに、標準品質の 1,024 x 1,024 サイズのイメージを 1000 個生成するようにリクエストします。

発生するコストの合計: 1000 画像 x 0.01 USD/画像 = 10 USD

カスタマイズ (微調整と継続的な事前トレーニング) の価格設定

アプリケーション開発者は、1000 組の画像とテキストを使用して Titan Image Generation モデルをカスタマイズします。トレーニング後、開発者はカスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。

微調整にかかる月額費用は、微調整トレーニング (0.005 USD × 1000 USD) + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1時間のカスタムモデル推論 (21 USD) = 5 USD+ 1.95 USD + 21 USD = 27.95 USD

プロビジョンドスループットの料金

アプリケーション開発者は、テキスト要約のユースケースとして、Titan Text – Express の 2 つのモデルユニットを 1 か月契約で購入します。

発生する月間コストの合計: 2 モデルユニット x 18.40 USD/時間 x 24 時間 x 31 日間 = 27,379.20 USD

アプリケーション開発者は、Titan Image Generator の基本モデルのモデルユニットを 1 か月契約で 1 ユニット購入します。

発生する費用の合計 = 1 * 16.20 USD * 24 時間 * 31 日間 = 12,052.80 USD

オンデマンド料金

アプリケーション開発者は、米国西部 (オレゴン) リージョンの Amazon Bedrock に対して次の API コールを行います: Anthropic の Claude モデルに対して、入力テキストの 11K トークンの入力を 4K トークンの出力にまとめるリクエスト。

発生するコストの合計: 11,000 トークン/1000 x 0.008 USD + 4,000 トークン/1000 x 0.024 USD = 0.088 USD + 0.096 USD = 0.184 USD

プロビジョンドスループットの料金

あるアプリケーション開発者が米国西部 (オレゴン) リージョンで Anthropic Claude Instant のモデルユニットを1つ購入しました。

発生する月間コストの合計: 1 モデルユニット x 39.60 USD x 24時間 x 31日 = 29,462.40 USD

オンデマンド料金

アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Cohere の Command モデルに対して、入力テキストの 6K トークンの入力を 2K トークンの出力にまとめるリクエスト。

発生するコストの合計 = 6K トークン/1000 x 0.00150 USD + 2K トークン/1000 x 0.0020 USD = 0.013 USD

アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Cohere の Command-Light モデルに対して、入力テキストの 6K トークンの入力を 2K トークンの出力にまとめるリクエスト。

発生するコストの合計 = 6K トークン/1000 * 0.0003 USD + 2K トークン/1000 * 0.0006 USD = 0.003 USD

アプリケーション開発者は、Amazon Bedrock に次の API 呼び出しを行います: Cohere の Embed English モデルまたは多言語モデルに、10K トークンの入力に対して埋め込みを生成するようリクエストします。

発生するコストの合計 = 10K トークン/1000 * 0.0001 USD = 0.001 USD

モデルのカスタマイズ (微調整)

アプリケーション開発者は、1000 トークンのデータを使用して Cohere コマンドモデルをカスタマイズします。トレーニング後、カスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。

微調整にかかる月額費用は、微調整トレーニング (0.004 USD ×1000 USD) + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (49.50 USD) = 55.45 USD

カスタムモデルのプロビジョニングされたスループット (1 か月間のコミット) で発生する月額コスト = 39.60 USD

プロビジョンドスループットの料金

アプリケーション開発者は、テキスト要約のユースケースとして、Meta Llama 2 の 1 モデルユニットを 1 か月の契約で購入します。

発生する月間コストの合計: 1 モデルユニット x 39.60 USD x 24時間 x 31日 = 29,462.40 USD

オンデマンド料金

アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Meta の Llama 2 Chat (13 B) モデルに対して、入力テキストの 2K トークンの入力を 500 トークンの出力にまとめるリクエスト。

発生するコストの合計 = 2K トークン / 1,000 * 0.00075 USD + 500 トークン / 1,000 * 0.001 USD = 0.002 USD

モデルのカスタマイズ (微調整)

アプリケーション開発者は、1000 トークンのデータを使用して Llama 2 の事前トレーニング済み (70B) モデルをカスタマイズします。トレーニング後、カスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。

微調整にかかる月額費用は、微調整トレーニング (0.00799 USD x 1000) + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (23.50 USD) = 33.44 USD

カスタムモデルのプロビジョニングされたスループット (1 か月間のコミット) で発生する月額コスト = 21.18 USD

プロビジョンドスループットの料金

アプリケーション開発者は、テキスト要約のユースケースとして、Meta Llama 2 の 1 モデルユニットを 1 か月の契約で購入します。

発生する月間コストの合計は、1 モデルユニット* 21.20 USD * 24 時間 * 31 日間 = 15,772.80 USD

料金の例

  • アプリケーション開発者は Amazon Bedrock に対して次の API 呼び出しを行います: AI21 の Jurrasic-2 Mid モデルに対して、入力テキストの 10,000 トークンの入力を 2,000 トークンの出力にまとめるリクエスト。

    発生するコストの合計: 10,000 トークン/1000 x 0.0125 USD + 2,000 トークン/1000 x 0.0125 USD = 0.15 USD

  • オンデマンド料金

    アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Amazon Titan Text – Lite モデルに対して、入力テキストの 8K トークンの入力を 2K トークンの出力にまとめるリクエスト。

    発生した 1 時間あたりの総コストは = 2 K トークン/1000 * 0.0003 USD + 1 K トークン/1000 * 0.0004 USD = 0.001 USD です。

    アプリケーション開発者が Amazon Bedrock に対して次の API コールを行います。Titan イメージジェネレーターの基本モデルに、標準品質の 1,024 x 1,024 サイズのイメージを 1000 個生成するようにリクエストします。

    発生するコストの合計: 1000 画像 x 0.01 USD/画像 = 10 USD

    カスタマイズ (微調整と継続的な事前トレーニング) の価格設定

    アプリケーション開発者は、1000 組の画像とテキストを使用して Titan Image Generation モデルをカスタマイズします。トレーニング後、開発者はカスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、デベロッパーはプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。

    微調整にかかる月額費用は次のとおりです。微調整トレーニング (0.005 USD* 500* 64)。ここで、0.005 USD は表示される画像あたりの価格、500 USD はステップ数、64 はバッチサイズ + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (21 USD) = 160 USD + 1.95 USD + 21 = 182.95 USD

    プロビジョンドスループットの料金

    アプリケーション開発者は、テキスト要約のユースケースとして、Titan Text – Express の 2 つのモデルユニットを 1 か月契約で購入します。

    発生する月間コストの合計: 2 モデルユニット x 18.40 USD/時間 x 24 時間 x 31 日間 = 27,379.20 USD

    アプリケーション開発者は、Titan Image Generator の基本モデルのモデルユニットを 1 か月契約で 1 ユニット購入します。

    発生する費用の合計 = 1 * 16.20 USD * 24 時間 * 31 日間 = 12,052.80 USD

  • オンデマンド料金

    アプリケーション開発者は、米国西部 (オレゴン) リージョンの Amazon Bedrock に対して次の API コールを行います: Anthropic の Claude モデルに対して、入力テキストの 11K トークンの入力を 4K トークンの出力にまとめるリクエスト。

    発生するコストの合計: 11,000 トークン/1000 x 0.008 USD + 4,000 トークン/1000 x 0.024 USD = 0.088 USD + 0.096 USD = 0.184 USD

    プロビジョンドスループットの料金

    あるアプリケーション開発者が米国西部 (オレゴン) リージョンで Anthropic Claude Instant のモデルユニットを1つ購入しました。

    発生する月間コストの合計: 1 モデルユニット x 39.60 USD x 24時間 x 31日 = 29,462.40 USD

  • オンデマンド料金

    アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Cohere の Command モデルに対して、入力テキストの 6K トークンの入力を 2K トークンの出力にまとめるリクエスト。

    発生するコストの合計 = 6K トークン/1000 x 0.00150 USD + 2K トークン/1000 x 0.0020 USD = 0.013 USD

    アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Cohere の Command-Light モデルに対して、入力テキストの 6K トークンの入力を 2K トークンの出力にまとめるリクエスト。

    発生するコストの合計 = 6K トークン/1000 * 0.0003 USD + 2K トークン/1000 * 0.0006 USD = 0.003 USD

    アプリケーション開発者は、Amazon Bedrock に次の API 呼び出しを行います: Cohere の Embed English モデルまたは多言語モデルに、10K トークンの入力に対して埋め込みを生成するようリクエストします。

    発生するコストの合計 = 10K トークン/1000 * 0.0001 USD = 0.001 USD

    モデルのカスタマイズ (微調整)

    アプリケーション開発者は、1000 トークンのデータを使用して Cohere コマンドモデルをカスタマイズします。トレーニング後、カスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。

    微調整にかかる月額費用は、微調整トレーニング (0.004 USD ×1000 USD) + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (49.50 USD) = 55.45 USD

    カスタムモデルのプロビジョニングされたスループット (1 か月間のコミット) で発生する月額コスト = 39.60 USD

    プロビジョンドスループットの料金

    アプリケーション開発者は、テキスト要約のユースケースとして、Meta Llama 2 の 1 モデルユニットを 1 か月の契約で購入します。

    発生する月間コストの合計: 1 モデルユニット x 39.60 USD x 24時間 x 31日 = 29,462.40 USD

  • オンデマンド料金

    アプリケーション開発者は、Amazon Bedrock に対して次の API コールを行います: Meta の Llama 2 Chat (13 B) モデルに対して、入力テキストの 2K トークンの入力を 500 トークンの出力にまとめるリクエスト。

    発生するコストの合計 = 2K トークン / 1,000 * 0.00075 USD + 500 トークン / 1,000 * 0.001 USD = 0.002 USD

    モデルのカスタマイズ (微調整)

    アプリケーション開発者は、1000 トークンのデータを使用して Llama 2 の事前トレーニング済み (70B) モデルをカスタマイズします。トレーニング後、カスタムモデルでプロビジョニングされたスループットを 1 時間使用して、モデルのパフォーマンスを評価します。微調整されたモデルは 1 か月間保存されます。評価後、開発者はプロビジョニングされたスループット (1mo commit) を使用してカスタマイズされたモデルをホストします。

    微調整にかかる月額費用は、微調整トレーニング (0.00799 USD x 1000) + 1 か月あたりのカスタムモデルストレージ (1.95 USD) + 1 時間のカスタムモデル推論 (23.50 USD) = 33.44 USD

    カスタムモデルのプロビジョニングされたスループット (1 か月間のコミット) で発生する月額コスト = 21.18 USD

    プロビジョンドスループットの料金

    アプリケーション開発者は、テキスト要約のユースケースとして、Meta Llama 2 の 1 モデルユニットを 1 か月の契約で購入します。

    発生する月間コストの合計は、1 モデルユニット* 21.20 USD * 24 時間 * 31 日間 = 15,772.80 USD

  • オンデマンド料金

    アプリケーション開発者は Amazon Bedrock に対して次の API 呼び出しを行います: SDXL モデルに対して、ステップサイズ 70 (高画質) の 512 x 512 の画像を生成するリクエスト。

    発生するコストの合計: 1 画像 x 0.036 USD/画像 = 0.036 USD

    アプリケーション開発者は Amazon Bedrock に対して次の API コールを行います: SDXL 1.0 モデルに対して、ステップサイズ 70 (高画質) の 1024 x 1024 の画像を生成するリクエスト。

    発生するコストの合計: 1 画像 x 0.08 USD/画像 = 0.08 USD

    プロビジョンドスループットの料金

    アプリケーション開発者は、SDXL1.0の 1 つのモデルユニットを 1 か月契約で購入します。

    発生する費用の合計 = 1 * 49.86 USD * 24 時間 * 31 日間 = 37,095.84 USD