Amazon Bedrock 模型評估功能現已開放歐洲 (蘇黎世) 區域使用

張貼日期: 2024年12月9日

Amazon Bedrock 上的模型評估可讓您評估、比較並為使用案例選擇最佳基礎模型。Amazon Bedrock 提供使用 LLM 即評判、程式設計式評估和人工評估的選項。您可以針對正確性、完整性和一致性等指標,以及拒絕回答和危害性等負責任 AI 指標使用 LLM 即評判。程式設計式評估可提供適用於準確性、穩健性和有害性等指標的演算法。此外,對於這些指標或主觀和自訂指標 (例如親和性或風格),您只需按幾下滑鼠鍵即可設定人工評估工作流程。您可以針對人工評估作業,使用您自己的員工或 AWS 管理的團隊來作為審核者。模型評估提供內建的策劃資料集,您也可以使用自有資料集。現在,客戶可以評估歐洲 (蘇黎世) 區域內的模型。

Amazon Bedrock 上的模型評估功能現已開放這些區域使用,提供的評估類型會因區域而有所不同。

若要進一步了解 Amazon Bedrock 上的模型評估功能,請參閱 Amazon Bedrock 評估頁面。若要開始使用,請在 AWS 管理主控台上登入 Amazon Bedrock,或使用 Amazon Bedrock API。