Amazon Bedrock ガードレール、サービスクォータの上限の引き上げを発表
Amazon Bedrock ガードレールでは、サービスクォータのデフォルトの上限を引き上げました。これにより、トラフィックの増加に合わせて 生成 AI アプリケーションをスケールできるようになりました。Bedrock ガードレールでは、さまざまなカテゴリにわたって、望ましくない有害なコンテンツやプロンプト攻撃をフィルタリングするための設定可能な保護手段、特定のトピックを定義および禁止するトピックフィルター、個人を特定できる情報 (PII) をマスキングする機密情報フィルター、特定の単語をブロックする単語フィルターを提供しています。また、モデル応答のグラウンディングと関連性を検出してモデルのハルシネーションを検出したり、自動推論を使用してモデル応答の事実に基づく主張を識別、修正、説明したりするための設定可能な保護手段も提供しています。これらのポリシーは、お客様固有のユースケースと責任ある AI のポリシーに合わせてカスタマイズできます。ガードレールは、Amazon Bedrock でホストされているモデル、セルフホストモデル、ApplyGuardrail API を使用するサードパーティーモデルなど、あらゆる基盤モデルに適用できるため、ユーザーエクスペリエンスを一貫させて、安全とプライバシーの管理を標準化することができます。
本日より、Bedrock ガードレールでは、サービスクォータの上限を引き上げ、処理できる 1 秒あたりのトランザクション数 (TPS) と 1 秒あたりのテキスト単位 (TUPS) を増やしました。これにより、トラフィック負荷の増加に合わせて生成 AI アプリケーションをスケールできます。この引き上げにより、ApplyGuardRail API を使用して 1 秒あたり最大 50 回の呼び出しを処理できるようになりました。これは、以前の制限であった 1 秒あたり 25 回の呼び出しから 2 倍の増加に相当します。コンテンツフィルター、機密情報フィルター、単語フィルターは、最大 200 TUPS の処理が可能になりました。これは従来の 25 TUPS から 8 倍の増加に相当します。
これらの制限は 米国東部 (バージニア北部) と 米国西部 (オレゴン) の AWS リージョンでご利用いただけます。
詳細については、技術文書と Bedrock ガードレールの製品ページを参照してください。