自動推論チェックに自然言語のテスト Q&A 生成が追加

投稿日: 2025年11月21日

AWS は、Amazon Bedrock ガードレールでの自動推論チェックのための自然言語テスト Q&A 生成を開始したことを発表しました。自動推論チェックでは、正式な検証手法を使用して、生成 AI モデルからの出力の正確性とポリシーへの準拠を検証します。自動推論チェックにより、LLM からの正しい回答を最大 99% の精度で検出できるため、モデル応答のあいまいさ検出をサポートすると同時に、AI によるハルシネーションの検出において証明可能な保証が得られます。

自動推論チェックを始めるには、自然言語の文書とサンプル Q&A を使用して自動推論ポリシーを作成してテストします。自動推論チェックでは、入力文書の内容を使用して各ポリシーについて最大 N 件のテスト Q&A が生成されるため、最初のポリシー生成から運用環境で使用できる洗練されたポリシーに至るまでの作業が軽減されます。

自動推論チェックのテスト生成は、現在、米国 (バージニア北部)、米国 (オハイオ)、米国 (オレゴン)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (パリ) の各リージョンで利用できます。お客様は Amazon Bedrock コンソールと Amazon Bedrock Python SDK からこのサービスにアクセスできます。

自動推論チェックの詳細と、それを生成 AI ワークフローに組み込む方法については、Amazon Bedrock のドキュメントを読むか、AWS AI ブログのチュートリアルおよび Bedrock ガードレールのウェブページをご確認ください。