Amazon Web Services ブログ
Amazon Bedrock のモデルアクセスの有効化や制限値の引き上げができない時の対応方法
Amazon Bedrock でモデルの推論をするには、はじめにモデルアクセスの有効化が必要です。また、デフォルトで割り当てられた制限を超えて推論等を行う場合は Quotas と呼ばれる制限値を引き上げる必要があります。デフォルトの制限値はサービスの適正な利用とパフォーマンスの維持向上を図るため継続的に調整が行われており、その中であなたの AWS アカウントのモデルアクセスの有効化や推論等の制限値に影響が発生する場合があります。影響を受けた際、どのように対応すればよいのかを示すのが本記事の目的です。
生成 AI の注目が高まるにつれ、生成 AI 、Amazon Bedrock をきっかけに初めて AWS を利用する方もいらっしゃると思います。そうした場合、想定外の影響を受けたとき AWS でどのように対応や問い合わせをすればよいのか戸惑うことも多いと理解しています。本記事はその戸惑いを解消するためにあり、生成 AI で AWS を活用いただく誰もが、詰まることなく影響を解消するための手順を説明します。はじめに Amazon Bedrock を利用するための基本的な手順をおさらいし、その後影響が発生した際の対応手順を示します。
Amazon Bedrock のモデルが使えるか試す方法
はじめに、AWS Console にログインし Amazon Bedrock のサービスにアクセスしてください。

Playground のメニューから、Select model を選択します。
Select model で、使いたいモデルを選択してください。まず、利用可能なモデルはリージョンごとに異なるため、現在 AWS Console で選択しているリージョンと、Model support by AWS Region を見比べ利用可能なリージョンを選択しているかご確認をお願いいたします。us-east-1 で Anthropic Claude の Sonnet 4.6 で US の推論プロファイルを使っています。
こんな形で、返答が帰ってくればモデルが利用できることがわかります。
制限値を引き上げする方法
上記でモデルを試したときに使用できない、あるいは使用できるもののデフォルトの制限値以下なのにそれ以上に制限が厳しい場合があります。
Amazon Bedrock のモデルに対し送信および受信できるトークン数の上限は、制限がかけられています。デフォルトの制限値は “Amazon Bedrock endpoints and quotas” を参照ください。特に新規作成されたアカウントでは、不正利用や意図しない利用を防ぐためデフォルトよりも Quota が低く抑えられています。そのため、ハンズオン等に新規アカウントで参加する場合は事前にアカウントを作成しておくことを推奨します。
※また、個人でもControl Tower を使うことを推奨します。メインのアカウントで利用実績があれば完全新規に比べ Quota が極端に抑えられることがないためです (参考 : スタートアップにおけるマルチアカウントの考え方と AWS Control Tower のすゝめ)
制限値を上げるには、Amazon Bedrock の同じ画面から “Quotas” のメニューを選択します。少し UI がわかりづらいですが、上限緩和が可能なモデルは “Request quota increase” のところが三本の点になっていて、こちらをクリックすると上限緩和申請を挙げることができます。
Quota の申請はボタンクリックですぐに行えます。
上限の設定値を書き申請します。注意書きにもある通り、大幅な申請はそれだけ時間がかかるので、デフォルト未満で設定されている場合はまずデフォルト値で設定するとよいです。
申請中の Quota 上限解除申請はこちらから確認できます。
制限値未満の利用にもかかわらずエラーが出る場合
Amazon Bedrock のモデルの利用制限は “Amazon Bedrock endpoints and quotas” に記載されていますが、ここで記載されている Quotas 未満の使用にも関わらず上限を超えた旨のエラーが発生する場合があります。
初手の対応方法として、クロスリージョン推論の利用を検討ください。Amazon Bedrock のリソース及び Quota はリージョンごとに設定されているため、複数リージョンの Quotas を有効に活用するのが効果的です。Amazon Bedrock は特定リージョンで推論に必要なリソースが枯渇していた場合、他のリージョンに推論をオフロードする “クロスリージョン推論” が実装されています。こちらの機能を実装することで、よりリソースを冗長化した推論を行うことが出来ます。詳細は “Amazon Bedrock の Cross Region Inference を試す” などをご参照ください。
クロスリージョン推論を試してもエラーが発生する、あるいは国内にとどめる必要があるなどオフロードできない要件がある場合、「サポートセンター」から「ケースの起票」をお願いいたします。サポートセンターは、AWS Console の右上のアイコンからアクセスできます。
サポートセンターの画面から「ケースの作成」を押下してください。
新 UI の場合、”サポートケースを起票したい” とリクエストして作成してください。
Enterprise および Business, Developer など、サポート契約されている場合は「技術」が選択できますので、そこから Amazon Bedrock のサービスを指定してケース起票をお願いいたします。サポート契約されていない方は、Quota に関する問合せであれば Service limit increase を利用ください。本番稼働予定など、早急に解消が必要な背景はぜひ追記ください。
件名
Amazon Bedrock で Quotas 未満にもかかわらずエラーが発生する説明
Amazon Bedrock で XXX のリージョンで YYY のモデルを Quotas 未満で利用しているにもかかわらず、ThrottlingExceptionが発生します。デフォルトの Quotas は “Amazon Bedrock endpoints and quotas” で確認済みです。クロスリージョン推論はすでに試していますが、エラーの発生頻度はお客様向けの提供に問題がないレベルには至っていません or アプリケーションの要件として ZZ のリージョンに閉じる必要があり、クロスリージョン推論は利用できません。本番環境での稼働を x/x に予定しており、検証をスケジュールに沿い進めるため有効化が行えるよう対応いただいてもよろしいでしょうか ?
制限値の引き上げができない場合
Quotas のラジオボタンがグレーアウトされている場合、“Service Quotas” の画面から制限値の引き上げを行うことが出来ません。「調整可能ではない」と記載されている場合は引き上げができません。
この場合、上限緩和したいクォータ名のリンクにアクセスすると Support Center に問い合わせるよう誘導があります。それに従い、モデルアクセスと同様にケースを作成し上限の緩和を申請します。なお、申請は必ず認可されるわけではない点はご了承ください。
件名と説明を例示します ( ※この通りに書かないといけないというわけではありません )。Quota の名前は適宜変更してください。本番稼働予定など、早急に解消が必要な背景はぜひ追記ください。
件名
Amazon Bedrock で “On-demand InvokeModel requests per minute for Anthropic Claude 3 Haiku” の Quotas 変更ができない説明
Amazon Bedrock で XXX のリージョンで件名のモデルの Quotas 上限を引き上げようとしたところ、アカウントレベルでの調整ができなかったためケースを起票させていただきました。現在、プロジェクトの検証のため・・・(以下、個別事情と希望する制限値について記載ください)
Access to this model is not available for channel program accounts.
モデルが使用できるか試した際にこのメッセージが出る場合、 Amazon Bedrock の再販ができないパートナー様からアカウントを払い出しされている可能性があります。この場合、お客様自身で AWS アカウントを作成いただくか Amazon Bedrock を再販可能なパートナー様からアカウントを調達する必要があります。
おわりに
生成 AI のポテンシャルをすべてのデベロッパーの方に届けるため、AWS では日々リソースの最適化に努めています。その過程で意図しない影響が発生した際は、本手順に沿い解決を頂ければ幸いです。











