Amazon Web Services ブログ
Amazon Bedrock で日本国内に閉じた Anthropic Claude 4.5 の推論が可能に!日本国内クロスリージョン推論のご紹介
世界中の組織が、お客様体験の向上、業務の効率化、イノベーションの推進を目的として、生成 AI の機能をアプリケーションに統合しています。生成 AI ワークロードの規模と重要性が増すにつれ、AI を活用したアプリケーションの一貫したパフォーマンス、信頼性、可用性を維持することが新たな課題となっています。同時に、多くの日本企業では、データレジデンシー要件やコンプライアンス規制により、データ処理を国内に限定する必要があります。
このニーズに応えるため、Amazon Bedrock では Anthropic の最新モデル Claude Sonnet 4.5 / Claude Haiku 4.5 と共に、日本国内クロスリージョン推論 (Japan Cross Region Inference) を導入しました。このマネージドな機能により、推論リクエストを日本国内のリージョンに限定自動的にルーティングし、開発者が需要の変動を予測したり、複雑な負荷分散メカニズムを実装したりすることなく、トラフィックバーストをシームレスに処理できるようになります。
本記事では、日本国内クロスリージョン推論の仕組み、そして Claude 4.5 シリーズと組み合わせることで、コンプライアンス要件を満たしながら生成 AI アプリケーションのパフォーマンスと信頼性を向上させる方法について解説します。
日本国内クロスリージョン推論のコア機能
日本国内クロスリージョン推論は、データを日本国内に留めながら、東京リージョンと大阪リージョンの計算リソースを活用することで、予期しないトラフィックバーストに対応します。このセクションでは、この機能の動作原理と、その基盤となる技術メカニズムについて説明します。
推論プロファイルの理解
Amazon Bedrock における推論プロファイルは、基盤モデルと、モデル呼び出しリクエストをルーティング可能なひとつ以上のリージョンのセットを定義します。Claude 4.5 の日本国内クロスリージョン推論プロファイルは、この概念を地理的境界内で適用し、リクエストを日本国内のリージョン (東京リージョンもしくは大阪リージョン) のいずれかにルーティングすることで、データレジデンシー要件を満たしながら、予期しないトラフィックバーストに備えて複数リージョンにトラフィックを分散できます。
推論プロファイルについて理解するために重要な概念として以下のふたつがあります。
- ソースリージョン – API リクエストが発行されるリージョン
- デスティネーションリージョン – Amazon Bedrock が推論のためにリクエストをルーティングできるリージョン
日本国内クロスリージョン推論では、デスティネーションリージョンは以下の日本国内のリージョンに限定されます。
- ap-northeast-1 (東京リージョン)
- ap-northeast-3 (大阪リージョン)
これにより、すべての推論処理が日本国内で完結し、データが国外に出ることはありません。
かつ、クロスリージョン推論では、モデルの可用性、キャパシティ、レイテンシーなど複数の要素を考慮して、最適なリージョンにリクエストをルーティングします。リクエストの割り振りには手動設定を必要とせず、自動的に最適な利用可能リージョンを選択します。
モニタリングとロギング
クロスリージョン推論を使用する場合、Amazon CloudWatch と AWS CloudTrail は、リクエストが発生したソースリージョンにのみログを記録します。これにより、推論リクエストが最終的にどこで処理されるかに関係なく、すべてのレコードを単一のリージョンに維持することで、モニタリングとロギングが簡素化されます。
どのリージョンがリクエストを処理したかを追跡するためには CloudTrail の記録を参照できます。CloudTrail イベントには、デスティネーションリージョンを指定する inferenceRegion
キーを持つ additionalEventData
フィールドが含まれています。これにより、日本国内の AWS インフラストラクチャー全体での推論リクエストの分散を監視および分析できます。
データセキュリティとコンプライアンス
Amazon Bedrock の通常のオンデマンド推論と同様に、クロスリージョン推論においても、データセキュリティの高い基準を維持します。クロスリージョン推論中に送信されるデータは、暗号化され、安全な AWS ネットワーク内に留まります。機密情報は、どのリージョンがリクエストを処理するかに関係なく、推論プロセス全体を通じて保護されます。
セキュリティとコンプライアンスは AWS とお客様の間における共同責任であるため、異なる地理的場所での推論リクエスト処理に伴う法的またはコンプライアンス要件も考慮する必要があります。日本国内クロスリージョン推論では、リクエストは日本国内のリージョンのみにルーティングされるため、データレジデンシー要件を満たしながら、高可用性とスループットのメリットを享受できます。
日本国内クロスリージョン推論の実装
Claude 4.5 で日本国内クロスリージョン推論は以下のステップで使用できます。
- 日本国内クロスリージョン推論プロファイル ID を使用 – Amazon Bedrock への API 呼び出しを行う際、リージョン固有のモデル ID の代わりに、日本国内クロスリージョン推論プロファイル ID (Claude Sonnet 4.5 の場合は
jp.anthropic.claude-sonnet-4-5-20250929-v1:0
、Claude Haiku 4.5 の場合はjp.anthropic.claude-haiku-4-5-20251001-v1:0
) を指定する。これはInvokeModel
API とConverse
API の両方で機能する。 - IAM 権限の設定 – 推論プロファイルと、デスティネーションリージョンの基盤モデルにアクセスするための適切な AWS Identity and Access Management (IAM) 権限を付与する。
適切な IAM 権限の詳細な設定方法と前提条件については、以下の公式ドキュメントをご参照ください。
サービスクォータの管理
日本国内クロスリージョン推論のサービスクォータ増加を申請する場合、それぞれのソースリージョン (日本の場合は東京もしくは大阪) の AWS Service Quotas コンソールを使用します。例えば Claude Sonnet 4.5 モデルのクォータ増加をリクエストする際には、以下の画像のように関連する特定のクォータを検索し、特定のリージョンでのワークロード要件に基づいて増加申請を提出できます。詳しくは Amazon Bedrock のクォータ管理ドキュメントをご参照ください。
日本国内クロスリージョン推論の料金
グローバル全体分散のクロスリージョン推論に比べて、日本国内クロスリージョン推論では 10% 上乗せの料金設定になっています。以下は Claude Sonnet 4.5 および Claude Haiku 4.5 の料金表です。その他のモデルも含めた詳しい料金は Amazon Bedrock 料金ページをご参照ください。
モデル | ゾーン | 入力 (100万トークン当たり) | 出力 (100万トークン当たり) | プロンプトキャッシュ書き込み (100万トークン当たり) | プロンプトキャッシュ読み込み (100万トークン当たり) |
Claude Sonnet 4.5 | グローバル | $3 | $15 | $3.75 | $0.3 |
Claude Sonnet 4.5 | 日本 (US/EU/オーストラリアも同様) | $3.3 | $16.5 | $4.125 | $0.33 |
Claude Haiku 4.5 | グローバル | $1 | $5 | $1.25 | $0.1 |
Claude Haiku 4.5 | 日本 (US/EU/オーストラリアも同様) | $1.1 | $5.5 | $1.375 | $0.11 |
日本国内とグローバルのクロスリージョン推論の選択
現在 Amazon Bedrock で Anthropic の従来モデルを使用している場合、Claude Sonnet/Haiku 4.5へアップグレードすることで生成 AI アプリケーションの性能を強化することができるでしょう。従来の Claude 3/3.5/3.7/4 といったシリーズのモデルから切り替えるべき主な理由としては、Sonnet 4.5/Haiku 4.5 のさまざまなドメインにおける優れたパフォーマンスが挙げられます。エージェント型ツール利用、コンピュータ利用といったエージェント構築における汎用な能力の向上だけでなく、特にコーディングや金融分析といった領域においても最先端のパフォーマンスを持つことが示されています。Claude Haiku 4.5 に関しては Sonnet シリーズの 1/3 のコストで利用でき、かつコード生成能力としても従来の Sonnet 4 よりも高いベンチマークスコアを達成するなど、コストパフォーマンスに優れたモデルであることも注目に値します。
また、発表から時間が経過した旧来のモデルは、最新のモデルよりも信頼性が低い可能性があることにご注意ください。最高レベルのサポートと信頼性を維持するために、ワークロードを最新なモデルに移行することを強くお勧めします。
グローバル分散のクロスリージョン推論を選択すべきケース
- データレジデンシー要件がない、または柔軟に対応できる
- 世界中の Amazon Bedrock 対応リージョンのリソースプールを活用して、最大限のスループットを確保したい
- グローバルに展開するアプリケーションで、世界中どこからでも同等のパフォーマンスを提供したい
日本国内クロスリージョン推論を選択すべきケース
- データレジデンシー要件があり、データを日本国内に留める必要がある
- 金融、医療、政府などの規制業界で、国内完結のデータ処理が求められる
- コンプライアンス規制により、データの国外転送が制限されている
- ビジネス要件として、データ処理場所を明確に特定・管理する必要がある
- 10%上乗せのプレミアム料金を許容できる
これまでデータレジデンシー要件により、東京リージョンで利用可能な Claude 3.5 Sonnet 等のモデルを利用されていたお客様も、ぜひ日本国内に閉じて推論処理を実行できる Claude Haiku 4.5 もしくは Claude Sonnet 4.5 の利用をご検討ください。
まとめ
Amazon Bedrock で新しく利用できるようになった Claude Sonnet/Haiku 4.5 では、日本国内クロスリージョン推論の機能により、日本に閉じたデータ処理が可能です。簡単な実装と、CloudTrail および CloudWatch による包括的なモニタリングにより、コンプライアンス要件を満たしながら、最先端の生成 AI モデルを活用できます。
Claude Sonnet/Haiku 4.5 の日本国内クロスリージョン推論をお試しいただく際には、Amazon Bedrock のマネジメントコンソールの「チャット/テキストのプレイグラウンド」において、そのメリットを直接体験することをお勧めします。また、皆様のアプリケーションにおいても、日本国内クロスリージョン推論プロファイル ID (Claude Sonnet 4.5 の場合は jp.anthropic.claude-sonnet-4-5-20250929-v1:0
、Claude Haiku 4.5 の場合は jp.anthropic.claude-haiku-4-5-20251001-v1:0
) を使用するようにコードを更新し、適切な IAM 権限を設定し、アプリケーションが日本国内の AWS インフラストラクチャーを活用して推論を実行する様子を監視してください。
Amazon Bedrock の日本国内クロスリージョン推論の詳細については、クロスリージョン推論によるスループットの向上、推論プロファイルのサポートされるリージョンとモデル、モデル呼び出しでの推論プロファイルの使用を参照してください。
著者について
本橋 和貴 (Motohashi, Kazuki) は、AWS Japan の機械学習ソリューションアーキテクトです。AI/ML 領域には8年ほど携わっており、AWS の生成 AI/ML サービスを利用する日本のお客様や AWS パートナー企業をサポートしています。最近購入したファイナルファンタジータクティクスを子育ての傍らプレイする時間を探していますが、まだ起動すらできていません。博士 (理学)。
菊地 貴彰(Kikuchi, Takaaki)は、AWS Japan で通信業界のお客様を担当するソリューションアーキテクトです。最近は学生時代の専攻である機械学習の知見を活かし、ビジネスにおける AI/ML の活用に関するご支援を多く行っています。趣味は音楽鑑賞であり、ライブ参加後は首が筋肉痛になります。
片山 洋平 (Katayama, Yohei) は AWS Japan のパブリックセクターのソリューションアーキテクトです。主に医療機関をはじめとしたヘルスケア業界のお客様のソリューション構築の支援を行なっています。週末は登山を嗜んでいます。