Amazon Bedrock AgentCore (プレビュー) の料金
AgentCoreをニーズに合わせてカスタマイズできます。サービスを組み合わせて使用し、単独または一緒に使用し、AI イニシアチブの拡大に合わせて使用した分だけ支払います。
支払いは実際に使用した分のみ
Amazon Bedrock AgentCore は、初期費用や最低料金なしで、柔軟な従量制の消費ベースの価格設定を提供しています。Runtime、ツール (Browser、Code Interpreter)、Gateway、Identity、Memory、Observability の各サービスは、個別に使用することも、組み合わせて使用することもできます。お客様が使用した分の料金のみをお支払いいただきます。このモジュール式アプローチにより、小規模から始めて、AI エージェントアプリケーションの成長に合わせてスケールできます。
AgentCore サービスは、2025 年 9 月 16 日まで無料でお試しいただけます。AgentCore の使用の一環として利用される追加の AWS サービスには、AWS の標準料金が適用されます (例えば、AgentCore Observability には CloudWatch の料金が適用されます)。2025 年 9 月 17 日以降、AWS はこのページに基づいて AgentCore サービスの使用料金をお客様に請求します。
Bedrock AgentCore サービス
Runtime
AgentCore Runtime は、動的 AI エージェントとツールのデプロイとスケーリングを目的として構築された安全なサーバーレスのランタイムです。
消費ベースの価格設定
従量課金制で、リソースの事前設定は不要です。CPU リソースについては、エージェントがアクティブに処理しているときに課金されます (LLM 応答を待機しているときの I/O 待機期間への課金はありません)。メモリリソースについては、エージェントが消費しているメモリに対してのみ課金されます。
主な詳細:
- 事前のリソース選択は不要です。
- 課金は 1 秒単位で計算され、その秒間に記録された CPU とメモリの使用量のうち、最低 1 秒で計算されます。
- 128 MB の最小メモリ料金が適用されます。
- お客様の ENI を介したネットワークデータ転送は、標準の EC2 料金で請求されます。
Browser
AgentCore Browser ツールは、高速で安全なクラウドベースのブラウザランタイムを提供し、AI エージェントが大規模にウェブサイトとやり取りできるようにします。
消費ベースの価格設定
従量課金制で、リソースの事前設定は不要です。CPU リソースについては、ツールがアクティブに処理しているときにのみ課金されます (LLM 応答を待っているだけの場合は I/O 待機期間には課金されません)。メモリリソースについては、エージェントが消費しているメモリに対してのみ課金されます。
主な詳細:
- 事前のリソース選択は不要です。
- 課金は 1 秒単位で計算され、その秒間に記録された CPU とメモリの使用量のうち、最低 1 秒で計算されます。
- 128 MB の最小メモリ料金が適用されます。
- お客様の ENI を介したネットワークデータ転送は、標準の EC2 料金で請求されます。
Code Interpreter
AgentCore Code Interpreter ツールを使用すると、AI エージェントはサンドボックス環境でコードを安全に記述して実行できるため、精度が高まり、複雑なエンドツーエンドのタスクを解決する能力が向上します。
消費ベースの価格設定
従量課金制で、リソースの事前設定は不要です。CPU リソースについては、ツールがアクティブに処理しているときにのみ課金されます (LLM 応答を待っているだけの場合は I/O 待機期間には課金されません)。メモリリソースについては、エージェントが消費しているメモリに対してのみ課金されます。
主な詳細:
- 事前のリソース選択は不要です。
- 課金は 1 秒単位で計算され、その秒間に記録された CPU とメモリの使用量のうち、最低 1 秒で計算されます。
- 128 MB の最小メモリ料金が適用されます。
- お客様の ENI を介したネットワークデータ転送は、標準の EC2 料金で請求されます。
Gateway
AgentCore Gateway は、API、Lambda 関数、および既存のサービスをエージェント互換ツールに簡単に変換できるだけでなく、エージェントがツールを見つけて使用するための安全な方法を提供します。
消費ベースの価格設定
エージェントが Gateway を介して行う API コールに対してのみ料金が発生します。ツール操作 (ListTools と InvokeTool)、検索クエリ、およびセマンティック検索機能用にインデックス化されたツールの数に基づいて課金されます。
主な詳細:
- 初期費用や長期契約は必要ありません
- ListTools と InvokeTool API は 128 KB のデータ転送単位で計測されます
Identity
AgentCore Identity は、エージェントの ID とアクセス管理を簡素化し、エージェントがユーザーに代わって、または事前に承認されたユーザーの同意を得て、エージェント自身で AWS リソースやサードパーティのツールやサービスに安全にアクセスできるようにします。
消費ベースの価格設定
AgentCore Runtime または AgentCore Gateway のいずれかを介して AgentCore Identity を使用する場合、AgentCore Identity の使用に対して追加料金が発生することはありません。その他のシナリオでは、使用した分のみ料金が発生し、エージェントから AgentCore Identity への OAuth トークンまたは API キーのリクエスト数に基づいて課金されます。
主な詳細:
- 最低料金や初期費用はありません
- 請求は、AWS 以外のリソースの認証を必要とするタスクを実行するためにリクエストされた OAuth トークンまたは API キーに基づいて計算されます。
- お客様が AgentCore Runtime または AgentCore Gateway を通じて AgentCore Identity を使用する場合、追加料金は発生しません。
Memory
AgentCore Memory を使用すると、複雑なメモリインフラストラクチャ管理が不要になり、AI エージェントが記憶する内容を完全に制御できるため、開発者はコンテキスト認識型エージェントを簡単に構築できます。
消費ベースの価格設定
料金は従量課金制です。料金体系はシンプルな使用量ベースで、御社の AI エージェントがどのように価値を創造するかを直接反映しています。
- 短期メモリは、取り込まれた未処理のイベントの数に基づいて料金が設定されるため、セッション中のコンテキストのコストを予測できます。
- 長期メモリの価格は、毎月保存されているメモリの数と取り出されたメモリの数に基づいて設定されるため、エージェントが永続的なデータを保存して使用する場合にのみ料金が発生します。
- 未処理のイベントから長期記憶を抽出するには、自動処理を含む組み込みメモリストラテジーか、モデルとプロンプトを選択してアカウントで実行されるカスタムメモリ戦略を選択できます。
主な詳細:
- 事前のリソース選択は不要です。
- 短期メモリの場合、請求額はイベント作成リクエストごとに計算されます
- 長期メモリストレージの場合、請求額は 1 日あたりの保存メモリ単位で計算され、1 か月間の平均が算出されます。
- 長期間のメモリ取得の場合、請求額はメモリ取得リクエストごとに計算されます。
Observability
AgentCore Observability を使用すると、開発者はエージェントのワークフローを完全に可視化して、本番環境における AI エージェントのパフォーマンスを追跡、デバッグ、監視できます。
消費ベースの価格設定
エージェントのために生成、保存、クエリされたテレメトリの使用料は従量課金制です。テレメトリデータは Amazon CloudWatch アカウントに取り込まれ、保存されます。データインジェストと保存、情報の取得と分析のためのクエリ、ログ内の機密/個人情報データのマスキングには料金がかかります。価格の詳細については、Amazon CloudWatch の料金表ページをご覧ください。
料金表
Service
|
Type
|
Resource
|
Price
|
|||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Runtime
|
|
|
|
|||||||||
Browser Tool
|
|
|
|
|||||||||
Code Interpreter
|
|
|
|
|||||||||
Gateway
|
|
|
|
|||||||||
Identity
|
消費ベース |
AWS 以外のリソースのトークンまたは API キーのリクエスト |
エージェントからリクエストされた 1,000 トークンまたは API キーあたり 0.010 USD (注: AgentCore Identity は、お客様が AgentCore Runtime または AgentCore Gateway のいずれかを介して使用する場合、追加料金なしでご利用いただけます) |
|||||||||
Memory
|
|
|
|
|||||||||
Observability
|
消費ベース |
ログ、指標、トレース |
Amazon CloudWatch 料金表に従って請求されます |
*カスタムメモリ抽出戦略では、アカウントでのモデル使用量に応じて追加料金が発生する場合があります
料金の例
Runtime
例: カスタマーサポートエージェントの配備
チャットとメールでユーザーの問い合わせを解決するカスタマーサポートエージェントを配置する場合を考えてみます。エージェントは、注文に関する問題、アカウントの確認、およびポリシーの明確化を処理します。検索拡張生成 (RAG) を使用して製品ポリシーを取得し、モデルコンテキストプロトコル (MCP) 互換ツールを使用して注文状況のクエリとサポートチケットの更新を行います。各エージェントセッションには、ベクトルストアへの 1 回の RAG 呼び出し、2 回の MCP ツール呼び出し(OrderAPI、TicketAPI など)、および 2 つの LLM 推論ステップによる高度なマルチステップ推論が含まれます。完全なセッション分離と、数秒で数百万セッションまで拡張できる柔軟性が必要なため、エージェントを AgentCore Runtime にデプロイしました。
毎月 1,000万 件のユーザーリクエストを処理し、各セッションは 60 秒間実行され、I/O 待機時間 (LLM 応答の待機または内部 API からのネットワーク応答の待機) は 70% です 。各エージェントセッションは、アクティブな処理中に 1 vCPU を使用し、2 GB のメモリを継続的に使用します。毎月の費用の内訳は次のとおりです。
セッションあたりの CPU コスト: 18 秒 (入出力待機時間の 70% に合わせて調整) × 1 vCPU × (0.0895/3600 USD) = 0.0004475 USD
セッションあたりのメモリコスト: 60 秒 × 2 GB × (0.00945 USD/3600 USD) = 0.000315 USD
セッションあたりの総コスト: 0.0007625 USD
月間合計: 1,000 万セッション × 0.0007625 USD = 7,625 USD
AgentCore Runtime の使用量ベースの価格設定により、I/O 待機時間ではなく、アクティブな CPU 処理時間に対してのみ支払いが発生するため、従来のコンピューティングオプションと比較して高いコスト効率が得られます。
Browser
例: 自動旅行予約システム
ウェブインタラクションを通じて旅行の計画と予約を完全に自動化する旅行予約 AI エージェントを作成する場合を考えてみます。実装には、フライトやホテルの検索、クリックのシミュレーション、価格の抽出、予約フォームの送信を行うヘッドレスブラウザを動的に管理する AgentCore Browser の安全なサーバーレスランタイムが必要です。AgentCore Browser ツールは、セッション分離型のサンドボックスコンピューティングや、ライブビューやセッションリプレイによる包括的なオブザーバビリティなど、エンタープライズグレードの機能を提供します。
エージェントは毎月 10 万件のリクエストを処理します。各ブラウザセッションは、I/O 待機時間が 80% の状態で 10 分間実行されます。アクティブな処理中は 2 vCPU、4 GB のメモリを継続的に使用します。毎月の費用の内訳は次のとおりです。
セッションあたりの CPU コスト: 120 秒 (I/O 待機時間が 80% になるように調整) × 2 vCPU × (0.0895/3600 USD) = 0.005967 USD
セッションあたりのメモリコスト: 600 秒 × 4 GB × (0.00945 USD/3600 USD) = 0.0063 USD
セッションあたりの総コスト: 0.012267 USD
月間合計: 10 万セッション × 0.012267 USD = 1,226.67 USD
Code Interpreter
例: 自然言語データ分析の自動化
データセットのクエリ、視覚化、統計分析をすべて自然言語で行い、ビジネスチームと製品チームをサポートするデータアナリストエージェントを導入する場合を考えてみます。エージェントは、サイトトラフィックとコンバージョン率の相関分析などの複雑なリクエストに対応する Python コードを動的に生成して実行します。企業のセキュリティポリシーに準拠した分離されたサンドボックス環境、複数の言語 (JavaScript、TypeScript、Python) 用のビルド済み実行ランタイム、および大容量ファイルサイズのサポートを提供する AgentCore Code Interpreter を利用します。
エージェントは毎月 10,000 件のリクエストを処理し、1 リクエストあたり 3 回のコードを実行します。各実行は、I/O 待機時間が 60% で 2 分間実行されます。アクティブな処理中は 2 vCPU、4 GB のメモリを継続的に使用します。毎月の費用の内訳は次のとおりです。
セッションあたりの CPU コスト: 48 秒 (I/O 待機時間が 60% になるように調整) × 2 vCPU × (0.0895/3600 USD) = 0.002387 USD
セッションあたりのメモリコスト: 120 秒 × 4GB × (0.00945 USD/3600 USD) = 0.00126 USD
セッションあたりの総費用: 0.003647 USD
月間合計: 3 万件の実行 × 0.003647 USD = 109.40 USD
Gateway
例: HR アシスタントエージェントを内部ツールに接続する
中規模企業向けに、社内ポリシーに関する質問、休暇残高、福利厚生登録、給与計算に関する問い合わせを処理する人事アシスタントエージェントを構築する場合を考えてみます。ユーザーのリクエストに応えるには、エージェントは複数の内部システム (オンボーディング、福利厚生、給与、休暇管理 API) にツールとしてアクセスする必要があります。AgentCore Gateway を使用して 200 の内部ツール用の MCP サーバーを作成し、エージェントがコードを記述せずにどこからでも操作できるようにします。ツールの使用精度を向上させるために、検索機能を活用してツールのメタデータにインデックスを付け、エージェントの呼び出し中にインタラクションコンテキストに基づいてツールを動的に照合できるようにします。
各エージェントインタラクションには、1 つの検索 API と 4 つの InvokeTool API 呼び出しが必要です。月間 5,000 万件のインタラクションの結果、検索件数は 5,000 万件、InvokeTool 呼び出しは 2 億件に上ります。毎月の費用の内訳は次のとおりです。
SearchToolIndex 料金: 200 ツール × 100 ツールあたり 0.02 USD= 0.04 USD
検索 API 料金: 5,000 万 × 25 USD/100 万 = 1,250 USD
InvokeTool API 料金: 2 億 × 5 USD/100 万 = 1,000 USD
月間合計: 2,250.04ドル
Identity
例: 安全なカスタマーサポートアクセス管理
複数のツールにアクセスして技術チームを支援するカスタマーサポートエージェントを運用する場合を考えてみます。サポートの会話には Slack、通話ログを取得するには Zoom、問題の追跡とコミットログには GitHub を使用します。実装では、AgentCore Identity を使用して、ユーザーまたはサポートエンジニアに「代わって」安全で委任されたアクセスを行います。このシステムは、既存のアイデンティティプロバイダー(Okta、Microsoft Entra ID、Amazon Cognito など)と互換性があり、OAuth トークンから IAM ロールまでのすべての認証方法を管理するため、カスタムセキュリティインフラストラクチャは不要です。
エージェントが月間 1 万人のアクティブユーザーによって使用され、それぞれ平均 5 回のインタラクションがあり、各ユーザーのセッションあたり 1 か月あたり 3 回のツールアクセスが必要であると仮定すると、毎月のコストは次のように分類されます。
リクエストされたトークンの総数: 1 万ユーザー × 5 セッション × 3 ツール = 15 万トークン
月間合計: 15 万件のリクエスト × 0.010 USD/1,000 = 1.50 USD
注: AgentCore Runtime または Gateway を使用する場合、AgentCore Identity は追加費用なしで含まれています。
Memory
例: パーソナライズされたコーディングアシスタントエージェントの実装
ソフトウェアエンジニアによる IDE や端末間でのコード記述、デバッグ、リファクタリングに役立つコーディングアシスタントエージェントを開発する場合を考えてみます。パーソナライズされたエクスペリエンスを提供するには、エージェントはセッション中もコンテキストを維持し、複数のセッションにわたってユーザーの好みを記憶する必要があります。実装では AgentCore Memory を使用して、エージェントに短期記憶 (即時の会話とイベント) と長期記憶 (セッション全体にわたる永続的な知識) の両方をエージェントに提供します。
ユーザーがエージェントと対話するたびに (コードスニペットを送信したり、コーディングに関する質問をしたりすると)、イベントが AgentCore Memory に送信され、短期記憶として保存されます。長期記憶用に、デバッグセッションの要約とセッション間のユーザー設定を自動的に抽出して保存する組み込み抽出戦略を設定します。その後、エージェントはこれらの長期記憶を取得して、開発者にパーソナライズされたエクスペリエンスを提供できます。
月間短期記憶イベントが 100,000 件、長期記憶が 10,000 件保存され、月間記憶検索が 20,000 件ある場合、費用の内訳は次のようになります。
短期記憶: 100,000 件のイベント × 0.25 USD/1,000 = 25 USD
長期記憶保存: 10,000 件の記憶 × 0.75 USD/1,000 = 7.50 USD
長期記憶検索: 20,000 回取得 × 0.50 USD/1,000 = 10 USD
月間合計: 42.50 USD
注:カスタム抽出戦略を使用すると、アカウントでのモデル使用に対して追加料金が発生する可能性があるため、長期保存費用は保存される記憶 1,000 件あたり 0.25 USD まで低くなります。
Observability
AgentCore Observability の料金の例については、こちらの CloudWatch 料金表を参照してください。
今日お探しの情報は見つかりましたか?
ぜひご意見をお寄せください。ページのコンテンツ品質の向上のために役立てさせていただきます