- Amazon Bedrock›
- AgentCore›
- 料金
Amazon Bedrock AgentCore の料金
AgentCore をニーズに合わせてカスタマイズでき、サービスを組み合わせたり、単独で、または一緒に使用したりできます。また、お支払いいただくのは、AI イニシアティブの拡大に応じて使用した分の料金のみです。
支払いは実際に使用した分のみ
Amazon Bedrock AgentCore は、初期費用や最低料金なしで、柔軟な従量制の消費ベースの価格設定を提供しています。ランタイム、ゲートウェイ、ポリシー (プレビュー)、アイデンティティ、メモリ、オブザーバビリティ、評価 (プレビュー)、ブラウザ、Code Interpreter など、各サービスと機能は個別に使用することも、組み合わせて使用することもでき、お客様が使用した分の料金のみをお支払いいただきます。このモジュール式アプローチにより、小規模から始めて、AI エージェントアプリケーションの成長に合わせて拡張できます。
AgentCore を無料で始めましょう。AWS の新規のお客様には、最大 200 USD の無料利用枠クレジットが付与されます。AWS 無料利用枠 のメリットを確認して、今すぐ構築を始めましょう。
注: AgentCore と AgentCore Evaluations は、プレビュー段階では無料で提供されます。
AgentCore のサービスと機能
Runtime
AgentCore Runtime は、エージェントとツールのデプロイとスケーリングを目的として構築された安全なサーバーレスランタイムです。迅速なイテレーションを実現するコードを直接デプロイするか、最大限の制御を実現するコンテナベースのデプロイを選択できます。
お支払いいただくのは、使用したアクティブなリソース分のみです
事前に割り当てられたリソース (つまり、固定のインスタンスサイズと、エージェントをホストしている間の 1 秒あたりのコスト) に対して課金する従来のコンピューティングサービスとは異なり、AgentCore Runtime ではアクティブなリソース消費分のみをお支払いいただきます。これにより、通常 I/O 待機 (LLM 応答、ツール/API コール、またはデータベースクエリの待機) に 30 ~ 70% の時間を費やすエージェントワークロードのコストが大幅に削減されます。事前に割り当てられた価格設定では、これらの待機期間中のアイドル状態の CPU 分をお支払いいただきます。AgentCore Runtime のアクティブなリソース消費量ベースの価格設定により、他のバックグラウンドプロセスが実行されていなくても、I/O 待機時間とアイドル時間は発生しません。
課金は、セッション期間中の CPU とメモリの消費量に基づいて 1 秒単位で計算されます。CPU リソースについては、実際の使用量に基づいて課金されます。エージェントが I/O 待機中に CPU を消費しない場合、CPU 料金は発生しません。メモリリソースについては、その秒までに消費されたピークメモリ分が課金されます。
主な詳細:
- 事前のリソース選択は不要です
- 課金は、実際の CPU 消費量とその秒までのピークメモリ消費量に基づいて、1 秒ごとに計算されます。最小課金は 1 秒です
- MicroVM の起動、初期化、アクティブな処理、アイドル期間からセッション終了(MicroVM のシャットダウン)までのセッション中の実際のリソース消費量に対してのみお支払いいただきます
- 課金には、アプリケーションのリソース使用量に加えて、システムオーバーヘッドも含まれます
- メモリには、128 MB の最小メモリ料金が適用されます
- ストレージコスト: コンテナのデプロイには ECR ストレージ (別途請求) が必要です。ダイレクトコードデプロイでは、2026 年 2 月 27 日以降、デプロイしたコードアーティファクトのサイズに対して S3 標準料金で課金されます。
- ネットワークデータの転送料金は、標準の EC2 料金で適用されます
Browser
AgentCore Browser は、エージェントが大規模にウェブサイトと対話できるようにする、高速で安全なクラウドベースのブラウザランタイムを提供します。
お支払いいただくのは、使用したアクティブなリソース分のみです
事前に割り当てられたリソース (つまり、固定のインスタンスサイズと、エージェントをホストしている間の 1 秒あたりのコスト) に対して課金する従来のコンピューティングサービスとは異なり、AgentCore Browser ではアクティブなリソース消費分のみをお支払いいただきます。これにより、通常 I/O 待機 (LLM 応答、ツール/API コール、またはデータベースクエリの待機) に 30 ~ 70% の時間を費やすエージェントワークロードのコストが大幅に削減されます。事前に割り当てられた価格設定では、これらの待機期間中のアイドル状態の CPU 分をお支払いいただきます。AgentCore Browser のアクティブなリソース消費量ベースの価格設定により、他のバックグラウンドプロセスが実行されていない場合でも、I/O 待機時間とアイドル時間は発生しません。
課金は、セッション期間中の CPU とメモリの消費量に基づいて 1 秒単位で計算されます。CPU リソースについては、実際の使用量に基づいて課金されます。エージェントが I/O 待機中に CPU を消費しない場合、CPU 料金は発生しません。メモリリソースについては、その秒までに消費されたピークメモリ分が課金されます。
主な詳細:
- 事前のリソース選択は不要です
- 課金は、実際の CPU 消費量とその秒までのピークメモリ消費量に基づいて、1 秒ごとに計算されます。最小課金は 1 秒です
- MicroVM の起動、初期化、アクティブな処理、アイドル期間からセッション終了(MicroVM のシャットダウン)までのセッション中の実際のリソース消費量に対してのみお支払いいただきます
- 課金には、アプリケーションのリソース使用量に加えて、システムオーバーヘッドも含まれます
- メモリには、128 MB の最小メモリ料金が適用されます
- ネットワークデータの転送料金は、標準の EC2 料金で適用されます
Code Interpreter
AgentCore Code Interpreter を使用すると、エージェントはサンドボックス環境でコードを安全に実行できるため、精度が向上し、複雑なエンドツーエンドのタスクを解決する能力が拡張されます。
お支払いいただくのは、使用したアクティブなリソース分のみです
事前に割り当てられたリソース (つまり、エージェントをホストしている間、固定のインスタンスサイズと 1 秒あたりのコスト) に対して課金する従来のコンピューティングサービスとは異なり、AgentCore Code Interpreter ではアクティブなリソース消費分のみをお支払いいただきます。これにより、通常 I/O 待機 (LLM 応答、ツール/API コール、またはデータベースクエリの待機) に 30 ~ 70% の時間を費やすエージェントワークロードのコストが大幅に削減されます。事前に割り当てられた価格設定では、これらの待機期間中のアイドル状態の CPU 分をお支払いいただきます。AgentCore Code Interpreter のアクティブなリソース消費量ベースの価格設定により、他のバックグラウンドプロセスが実行されていなくても、I/O 待機時間やアイドル時間は発生しません。
課金は、セッション期間中の CPU とメモリの消費量に基づいて 1 秒単位で計算されます。CPU リソースについては、実際の使用量に基づいて課金されます。エージェントが I/O 待機中に CPU を消費しない場合、CPU 料金は発生しません。メモリリソースについては、その秒までに消費されたピークメモリ分が課金されます。
主な詳細:
- 事前のリソース選択は不要です
- 課金は、実際の CPU 消費量とその秒までのピークメモリ消費量に基づいて、1 秒ごとに計算されます。最小課金は 1 秒です
- MicroVM の起動、初期化、アクティブな処理、アイドル期間からセッション終了(MicroVM のシャットダウン)までのセッション中の実際のリソース消費量に対してのみお支払いいただきます
- 課金には、アプリケーションのリソース使用量に加えて、システムオーバーヘッドも含まれます
- メモリには、128 MB の最小メモリ料金が適用されます
- ネットワークデータの転送料金は、標準の EC2 料金で適用されます
Gateway
Amazon Bedrock AgentCore Gateway を使用すると、API と Lambda 関数をエージェント互換ツールに変換し、既存の MCP サーバーに接続することで、エージェントはツールに安全にアクセスできます。
消費ベースの価格設定
エージェントが Gateway を介して行う API コールに対してのみ料金が発生します。MCP オペレーション (ListTools、CallTool、Ping など)、検索クエリ、セマンティック検索機能用にインデックス化されたツールの数に基づいて課金されます。
主な詳細:
- 初期費用や長期契約は必要ありません
- ネットワークデータの転送料金は、標準の EC2 料金で適用されます
ポリシー (プレビュー)
Amazon Bedrock AgentCore のポリシーにより、エージェントが実行するアクションを包括的に制御できるため、エージェントが速度を落とすことなく、定義された範囲内にとどまることができます。
消費ベースの価格設定
料金が発生するのは、エージェントの実行中に実行された承認リクエストに対してのみです。エージェントが AgentCore Gateway を介してツールを呼び出すたびに、ポリシーはそのアクションをルールに照らし合わせてチェックし、許可するか拒否するかを決定します。
さらに、Policy では自然言語によるポリシー作成が提供されており、シンプルな自然言語による記述を使用して Cedar ポリシーを作成できます。自然言語を Cedar ポリシーステートメントに変換する場合、処理される 1,000 ユーザー入力トークンごとに課金されます。
Identity
AgentCore Identity は、エージェントの ID とアクセス管理を簡素化し、エージェントがユーザーに代わって、または事前に承認されたユーザーの同意を得て、エージェント自身で AWS リソースやサードパーティのツールやサービスに安全にアクセスできるようにします。
消費ベースの価格設定
AgentCore Runtime または AgentCore Gateway のいずれかを介して AgentCore Identity を使用する場合、AgentCore Identity の使用に対して追加料金が発生することはありません。その他のシナリオでは、使用した分のみ料金が発生し、エージェントから AgentCore Identity への OAuth トークンまたは API キーのリクエスト数に基づいて課金されます。
主な詳細:
- 最低料金や初期費用はありません
- 請求は、AWS 以外のリソースの認証を必要とするタスクを実行するためにリクエストされた OAuth トークンまたは API キーに基づいて計算されます
- お客様が AgentCore Runtime または AgentCore Gateway を通じて AgentCore Identity を使用する場合、追加料金は発生しません
Memory
AgentCore Memory を使用すると、複雑なメモリインフラストラクチャ管理が不要になり、エージェントが記憶する内容を完全に制御できるため、開発者はコンテキスト認識型エージェントを簡単に構築できます。
消費ベースの価格設定
料金は従量課金制です。料金体系はシンプルな使用量ベースで、御社のエージェントがどのように価値を創造するかを直接反映しています。
- 短期記憶は、作成された未処理のイベントの数に基づいて料金が設定されるため、セッション中のコンテキストのコストを予測できます。
- 長期記憶レコードの料金は、毎月処理および保存される記憶の数と、記憶レコード取得呼び出しの数に基づいて決まるため、エージェントが処理された知識を保存および使用する場合にのみ料金が発生します。
- 未処理のイベントから長期記憶を抽出するには、自動処理を含む組み込みのメモリ戦略、またはモデルとプロンプトを選択してアカウントで実行される、より構成可能なメモリ戦略のいずれかを選択できます。
主な詳細:
- 事前のリソース選択は不要です。
- 短期記憶の場合、請求額はイベント作成リクエストごとに計算されます
- 長期メモリストレージの場合、課金は1日あたりに保存された記憶レコードごとに計算され、月全体で平均化されます
- 長期記憶取得の場合、請求額は記憶取得リクエストごとに計算されます
Observability
AgentCore Observability を使用すると、開発者はエージェントのワークフローを完全に可視化して、本番環境におけるエージェントのパフォーマンスを追跡、デバッグ、監視できます。
消費ベースの価格設定
エージェントのために生成、保存、クエリされたテレメトリの使用料は従量課金制です。テレメトリデータは Amazon CloudWatch アカウントに取り込まれ、保存されます。データインジェストと保存、情報の取得と分析のためのクエリ、ログ内の機密情報/個人を特定できる情報 (PII) データのマスキングに対して料金が発生します。価格の詳細については、Amazon CloudWatch の料金表ページをご覧ください。
評価 (プレビュー)
AgentCore Evaluations は、実際の行動に基づいてエージェントの質を継続的に検査するのに役立ちます。チームは、共通の品質ディメンションで 13 種類の組み込み評価ツールを使用したエージェント評価を実行したり、特定のビジネス要件に合わせてカスタム評価ツールを作成したりできます。結果は Amazon CloudWatch 搭載の AgentCore Observability に統合され、統合モニタリングが可能になります。
消費ベースの価格設定
使用した分に対してのみ料金をお支払いいただきます。組み込み評価ツールの場合、評価中に処理される入力トークンと出力トークンに基づいて AgentCore によって料金が請求されます。独自の LLM インフラストラクチャを使用してカスタム評価を行う場合は、実施した評価ごとに支払いますが、使用したモデルに基づいて個別の推論コストがかかります。
主な詳細:
- 前払いの義務や最低料金はありません
- 設定可能な品質閾値による CI/CD 統合を含む
- サンプリングルールとダッシュボード集計による生産モニタリング
- パーセンテージベースのサンプリング、条件付きサンプリング、選択的メトリック監視によるコスト管理
- モデル使用料は組み込み評価ツールに含まれており、別途モデル料金はかかりません
- カスタム評価では、アカウントに追加のモデル使用料が発生します
料金表
|
Service/Capability
|
Type
|
Resource
|
Price
|
|||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Runtime
|
|
|
|
|||||||||
|
Browser ツール
|
|
|
|
|||||||||
|
Code Interpreter
|
|
|
|
|||||||||
|
Gateway
|
|
|
|
|||||||||
|
Identity
|
消費ベース |
AWS 以外のリソースのトークンまたは API キーのリクエスト |
エージェントからリクエストされた 1,000 トークンまたは API キーあたり 0.010 USD (注: AgentCore Identity は、お客様が AgentCore Runtime または AgentCore Gateway のいずれかを介して使用する場合、追加料金なしでご利用いただけます) |
|||||||||
|
Memory
|
|
|
|
|||||||||
|
Observability
|
消費ベース
|
スパン、ログ、メトリクス
|
Amazon CloudWatch 料金表に従って請求されます |
|||||||||
|
評価 (プレビュー)
|
|
|
|
|||||||||
|
ポリシー (プレビュー)
|
|
|
|
*オーバーライドおよびセルフマネージド戦略が組み込まれた場合、アカウントでのモデル使用に対して追加料金が発生する場合があります
料金の例
Runtime
例: カスタマーサポートエージェントの配備
チャットとメールでユーザーの問い合わせを解決するカスタマーサポートエージェントを配置する場合を考えてみます。エージェントは、注文に関する問題、アカウントの確認、およびポリシーの明確化を処理します。検索拡張生成 (RAG) を使用して製品ポリシーを取得し、モデルコンテキストプロトコル (MCP) 互換ツールを使用して注文状況のクエリとサポートチケットの更新を行います。各エージェントセッションには、ベクトルストアへの 1 回の RAG 呼び出し、2 回の MCP ツール呼び出し(OrderAPI、TicketAPI など)、および 2 つの LLM 推論ステップによる高度なマルチステップ推論が含まれます。完全なセッション分離と、数秒で数千のセッションに拡張できる柔軟性が必要なため、エージェントを AgentCore Runtime にデプロイしました。
毎月 1,000 万件のユーザーリクエストを処理し、各セッションは 70% の I/O 待機時間 (LLM 応答と API コールの待機) で 60 秒間実行され、I/O 中は他のバックグラウンドプロセスは実行されません。各エージェントセッションは、アクティブな処理中に 1vCPU を使用します。メモリ使用量は、初期化時には 1 GBから始まり、RAG 処理中に 2 GB に増加し、セッションの残りの間、複雑なツール呼び出し中に 2.5 GB でピークに達します。毎月の費用の内訳は次のとおりです。
セッションあたりの CPU コスト: 18 秒 (アクティブな処理時間のみ) × 1vCPU × (0.0895/3600 USD) = 0.0004475 USD
セッションあたりのメモリコスト: 10 秒 × 1GB × (0.00945/3600 USD) + 20 秒 × 2GB × (0.00945/3600 USD) + 30 秒 × 2.5GB × (0.00945/3600 USD) = 0.000026 USD + 0.000053 USD + 0.000197 USD = 0.000276 USD
セッションあたりの総費用: 0.0007235 USD
月間合計: 1,000 万セッション × 0.0007235 USD = 7,235 USD
ストレージコスト: コンテナベースのデプロイでは、公開されている ECR レートに基づいて ECR ストレージを個別に管理します。代わりに直接コードデプロイを使用した場合、コードアーティファクトには S3 標準価格(2026 年 2 月 27 日以降)が適用されます。100 MBのエージェントの場合、合計で月額 0.0023 USDのストレージコストになります。
事前に割り当てられた価格との比較: このワークロードが、事前に割り当てられたリソースに対して課金されるサービスで実行される場合、60 秒間全体のピーク使用量 (2.5 GB のメモリ、1 vCPU) をプロビジョニングする必要があり、CPU コストは最大 3.3 倍、メモリコストは最大 1.4 倍高くなります。上記の例では、CPU 使用量がワークロードコスト全体の 62% を占めていることを考えると、CPU コストの大幅な削減となります。AgentCore Runtime の使用量ベースの価格設定は、「I/O 待機無料」という利点を自動的に反映し、スケールアップ時の実際のメモリ使用量に対してのみ課金されるため、従来のコンピューティングオプションと比較して大幅なコスト効率が実現されます。
Browser
例: 自動旅行予約システム
ウェブでのやり取りを通じて旅行の計画と予約全体を自動化する、旅行予約エージェントを作成する予定です。実装には、フライトやホテルの検索、クリックのシミュレーション、価格の抽出、予約フォームの送信を行うヘッドレスブラウザを動的に管理する AgentCore Browser の安全なサーバーレスランタイムが必要です。AgentCore Browser ツールは、セッション分離型のサンドボックスコンピューティングや、ライブビューやセッションリプレイによる包括的なオブザーバビリティなど、エンタープライズグレードの機能を提供します。
エージェントは毎月 10 万件のリクエストを処理します。各ブラウザセッションは、80 % の I/O 待機時間で 10 分間実行されます。 アクティブな処理中は 2vCPU と 4GB のメモリを継続的に使用し、I/O 時には 0.4vCPU と 5GB のメモリを使用します。毎月の費用の内訳は次のとおりです。
セッションあたりの CPU コスト: 120 秒 (I/O 待機時間が 80% になるように調整) × 2 vCPU × (0.0895/3600 USD) = 0.005967 USD
セッションあたりのメモリコスト: 600 秒 × 4 GB × (0.00945 USD/3600 USD) = 0.0063 USD
セッションあたりの総コスト: 0.012267 USD
月間合計: 10 万セッション × 0.012267 USD = 1,226.67 USD
Code Interpreter
例: 自然言語データ分析の自動化
データセットのクエリ、視覚化、統計分析をすべて自然言語で行い、ビジネスチームと製品チームをサポートするデータアナリストエージェントを導入する場合を考えてみます。エージェントは、サイトトラフィックとコンバージョン率の相関分析などの複雑なリクエストに対応する Python コードを動的に生成して実行します。企業のセキュリティポリシーに準拠した分離されたサンドボックス環境、複数の言語 (JavaScript、TypeScript、Python) 用のビルド済み実行ランタイム、および大容量ファイルサイズのサポートを提供する AgentCore Code Interpreter を利用します。
エージェントは毎月 10,000 件のリクエストを処理し、1 リクエストあたり 3 回のコードを実行します。各実行は、I/O 待機時間が 60% で 2 分間実行されます。アクティブな処理中は 2 vCPU、4 GB のメモリを継続的に使用します。毎月の費用の内訳は次のとおりです。
セッションあたりの CPU コスト: 48 秒 (I/O 待機時間が 60% になるように調整) × 2 vCPU × (0.0895/3600 USD) = 0.002387 USD
セッションあたりのメモリコスト: 120 秒 × 4GB × (0.00945 USD/3600 USD) = 0.00126 USD
セッションあたりの総費用: 0.003647 USD
月間合計: 3 万件の実行 × 0.003647 USD = 109.40 USD
Gateway
例: HR アシスタントエージェントを内部ツールに接続する
中規模企業向けに、社内ポリシーに関する質問、休暇残高、福利厚生登録、給与計算に関する問い合わせを処理する人事アシスタントエージェントを構築する場合を考えてみます。ユーザーのリクエストに応えるには、エージェントは複数の内部システム (オンボーディング、福利厚生、給与、休暇管理 API) にツールとしてアクセスする必要があります。AgentCore Gateway を使用して 200 の内部ツール用の MCP サーバーを作成し、エージェントがコードを記述せずにどこからでも操作できるようにします。ツールの使用精度を向上させるために、検索機能を活用してツールのメタデータにインデックスを付け、エージェントの呼び出し中にインタラクションコンテキストに基づいてツールを動的に照合できるようにします。
各エージェントインタラクションには、1 つの検索 API と 4 つの InvokeTool API 呼び出しが必要です。月間 5,000 万件のインタラクションの結果、検索件数は 5,000 万件、InvokeTool 呼び出しは 2 億件に上ります。毎月の費用の内訳は次のとおりです。
SearchToolIndex 料金: 200 ツール × 100 ツールあたり 0.02 USD= 0.04 USD
検索 API 料金: 5,000 万 × 25 USD/100 万 = 1,250 USD
InvokeTool API 料金: 2 億 × 5 USD/100 万 = 1,000 USD
月間合計: 2,250.04ドル
ポリシー (プレビュー)
例:
運用チームがベンダーの選択、発注書の作成、請求書の承認を管理するのに役立つ調達自動化エージェントを開発する予定です。アクションが定義済みのビジネスルールに従うようにするには、AgentCore Gateway ツールを使用してポリシーを作成し、定義済みのポリシーに照らしてアクションが実行される前に、すべてのアクションを自動的に検証します。エージェントがアクション (購入承認の送信や支払いの開始など) を実行しようとするたびに、Gateway はツールコールをインターセプトして、アクションが許可されているか拒否されているかを確認します。エージェントが 1 か月に 10 万セッションを処理し、各セッションで平均 5 回のツールコールを行うと仮定します。ツール呼び出しごとに 1 つの承認リクエストを実装する場合、1 か月あたり 50 万件の承認リクエストを行うことになります。費用の内訳は以下のとおりです。
承認リクエスト = 100K セッション x 5 ツールコール/セッション x 1 ポリシー適用/ツールコール = 50 万件の承認リクエスト
月間合計: 50 万件のリクエスト x 0.000025 = 12.50 USD
デプロイ前に、チームはオプションで自然言語ポリシー作成を使用して、オンボーディングとポリシーのセットアップを簡素化できます。Cedar ポリシーを手動で記述する代わりに、ルールを平易な言葉で記述し、AgentCore はそれを Cedar ポリシーステートメントに変換します。この作成手順中に処理されたユーザー入力トークンの数に基づいて、1 回限りの料金が請求されます。チームが 10,000 トークンを使用して複数のポリシーを作成した場合、費用は次のようになります。
ポリシー作成 = 20K トークン × 入力トークン 1,000 個あたり 0.13 USD = 2.60 USD
注: オブザーバビリティが有効になっている場合は、標準の CloudWatch 料金が適用されます。
Identity
例: 安全なカスタマーサポートアクセス管理
複数のツールにアクセスして技術チームを支援するカスタマーサポートエージェントを運用する場合を考えてみます。サポートの会話には Slack、通話ログを取得するには Zoom、問題の追跡とコミットログには GitHub を使用します。実装では、ユーザーまたはサポート エンジニアの安全な委任アクセスのために AgentCore Identity を使用します。このシステムは、既存のアイデンティティプロバイダー (Amazon Cognito、Okta、Microsoft Entra ID など) と互換性があり、OAuth トークンから API キーまですべての認証方法を管理し、カスタムセキュリティインフラストラクチャの必要性を排除します。
エージェントが月間 1 万人のアクティブユーザーによって使用され、それぞれ平均 5 回のインタラクションがあり、各ユーザーのセッションあたり 1 か月あたり 3 回のツールアクセスが必要であると仮定すると、毎月のコストは次のように分類されます。
リクエストされたトークンの総数: 1 万人のユーザー × 5 セッション × 3 ツール = 15 万トークン
月間合計: 15 万件のリクエスト × 0.010 USD/1,000 = 1.50 USD
注: AgentCore Runtime または Gateway を使用する場合、AgentCore Identity は追加費用なしで含まれています。
Memory
例: パーソナライズされたコーディングアシスタントエージェントの実装
ソフトウェアエンジニアによる IDE や端末間でのコード記述、デバッグ、リファクタリングに役立つコーディングアシスタントエージェントを開発する場合を考えてみます。パーソナライズされたエクスペリエンスを提供するには、エージェントはセッション中もコンテキストを維持し、複数のセッションにわたってユーザーの好みを記憶する必要があります。実装では AgentCore Memory を使用して、エージェントに短期記憶 (即時の会話とイベント) と長期記憶 (セッション全体にわたる永続的な知識) の両方をエージェントに提供します。
ユーザーがエージェントと対話するたびに (コードスニペットを送信したり、コーディングに関する質問をしたりすると)、イベントが AgentCore Memory に送信され、短期記憶として保存されます。長期記憶用に、デバッグセッションの要約とセッション間のユーザー設定を自動的に抽出して保存する組み込み抽出戦略を設定します。その後、エージェントはこれらの長期記憶を取得して、開発者にパーソナライズされたエクスペリエンスを提供できます。
月間 100,000 件の短期記憶イベント、保存された長期記憶レコード 10,000 件、月間 20,000 件の記憶レコード取得呼び出しの場合、費用の内訳は次のようになります。
短期記憶: 100,000 件のイベント × 0.25 USD/1,000 = 25 USD
長期記憶保存: 10,000 件の記憶 × 0.75 USD/1,000 = 7.50 USD
長期記憶検索: 20,000 回取得 × 0.50 USD/1,000 = 10 USD
月間合計: 42.50 USD
注: オーバーライド抽出戦略が組み込まれているため、長期保存コストは保存されるメモリ 1,000 件あたり 0.25 USD と低くなります。ただし、アカウントでモデルを使用すると追加料金が発生する場合があります。
Observability
例: マルチエージェント金融アドバイザリープラットフォーム
投資リサーチ、ポートフォリオ分析、規制コンプライアンスチェックを担当する複数の専門エージェントを備えた包括的な財務アドバイザリープラットフォームを導入する予定です。各エージェントは、データベースやウェブ検索のクエリ、金融データプロバイダーへの API コール、文書分析など、複雑な複数段階の推論を行います。このプラットフォームは、数百万件のトランザクションを処理し、すべてのエージェントのインタラクションにわたるトレース、メトリクス、ログなどの広範なテレメトリ データを生成します。AgentCore Observability を使用すると、包括的な監査証跡を通じてパフォーマンスを監視し、問題をデバッグし、金融規制への準拠を確認できます。
プラットフォームは、エージェントのやり取り、API コール、システムイベントから毎月 10 TB のオブザーバビリティデータを生成します。スパンの 30% がイベントログ (モデル呼び出し、ツールコール) であると仮定すると、約 6 TB (スパンイベントあたり 2 KB のログデータを想定) が CloudWatch 標準ログに書き込まれます。毎月の費用の内訳は次のとおりです。
月単位のスパンインジェスト料金: 10 TB × 1,000 GB/TB × 0.35 USD/GB = 3,500 USD
イベントログの月間料金: 6 TB × 1,000 GB/TB × 0.50 USD/GB = 3,000 USD
月間合計: 3,500 USD + 3,00 USD = 6,500 USD
*CloudWatch に送信されるすべてのメトリクスおよび非テレメトリ (標準) ログデータには、標準の CloudWatch 料金が適用されます。
評価 (プレビュー)
例: E コマースのカスタマーサービスエージェントの品質モニタリング
E コマースプラットフォーム向けに、注文の問い合わせ、返品処理、商品の推奨を処理するカスタマーサービスエージェントを配置する予定です。一貫したサービス品質を確保するには、AgentCore Evaluations を使用して、開発環境と実稼働環境全体でエージェントのパフォーマンスを監視します。実装では、3 種類の組み込みトレースレベル評価ツール (正確性、有用性、目標達成率) と、ビジネス固有の品質メトリクス用の 1 つのカスタム評価ツールが使用されます。
開発中、CI/CD Pipeline は毎月 5,000 件のテストインタラクションを評価します。本番環境では、サンプリングルールを通じてライブインタラクションの 2% を監視し、毎月 10,000 件の顧客との会話を評価します。組み込みの各評価では、平均 15,000 の入力トークン (会話履歴、製品カタログ、注文の詳細など) が処理され、スコアリング用の 300 の出力トークンが生成されます。
毎月の費用の内訳は次のとおりです。
組み込み評価ツール:
- 評価されたインタラクションの合計: 15,000 (開発 5,000 + 生産 10,000)
- インタラクションごとの組み込み評価ツール: 3 種類 (正確性、有用性、目標達成率)
- 総評価数: 15,000 インタラクション × 3 人の評価者 = 45,000 件の評価
- 入力トークン: 45,000 件の評価 × 15,000 トークン = 6 億 7,500 万トーク
- 出力トークン: 45,000 件の評価 × 300 トークン = 1,350 万トークン
- 投入コスト: 6 億 7,500 万トークン × 2.40 USD/1 M = 1,620 USD
- アウトプットコスト: 1,350 万トークン × 12.00 USD/1 M = 162 USD
- 組み込み評価ツールの小計: 1,782 USD
カスタム評価:
- 合計カスタム評価数: 15,000 インタラクション × 1 人のカスタム評価者 = 15,000 件の評価
- カスタム評価コスト: 15,000 件の評価 × 1.50 USD/1,000 = 22.50 USD
月間合計: 1,804.50 USD
注: 組み込み評価ツールにはモデル使用コストが含まれます。カスタム評価では、アカウントに追加のモデル使用料が発生します。
I want to
start building with AgentCore
今日お探しの情報は見つかりましたか?
ぜひご意見をお寄せください。ページのコンテンツ品質の向上のために役立てさせていただきます