Amazon Bedrock のモデル評価が欧州 (チューリッヒ) で利用可能に
Amazon Bedrock のモデル評価では、ユースケースに最適な基盤モデルを評価、比較、選択することができます。Amazon Bedrock では、LLM-as-a-judge、プログラムによる評価、人間による評価のいずれかを選択できます。LLM-as-a-judge は、正確性、完全性、一貫性などのメトリクスだけでなく、回答拒否や有害性などの責任ある AI メトリクスにも使用できます。プログラムによる評価では、精度、堅牢性、有害性などのメトリクスのアルゴリズムが提供されます。さらに、これらのメトリクス、または親しみやすさ、スタイル、などの主観的なメトリクスやカスタムメトリクスについては、数回クリックするだけで人間による評価のワークフローを設定できます。人間による評価では、自社の従業員や AWS が管理するチームをレビュー担当者として活用します。モデル評価には、厳選されたデータセットが組み込まれていますが、独自のデータセットを持ち込むこともできます。お客様は欧州 (チューリッヒ) でモデルを評価できるようになりました。
Amazon Bedrock のモデル評価は、現在これらのリージョンでご利用になれます。利用可能な評価タイプはリージョンによって異なります。
Amazon Bedrock でのモデル評価の詳細については、Amazon Bedrock の評価ページをご覧ください。開始するには、AWS マネジメントコンソールで Amazon Bedrock にサインインするか、Amazon Bedrock API を使用してください。