Amazon Bedrock 模型評估功能現在支援評估自訂模型匯入的功能
Amazon Bedrock 上的模型評估可讓您評估、比較並為使用案例選擇最佳基礎模型。Amazon Bedrock 提供自動評估和人工評估選項。您可以使用具有準確性、穩健性和毒性等預先定義演算法的指標來自動評估。此外,對於這些指標或主觀和自訂指標 (例如親和性、風格,以及與品牌語音的一致性),您只需按幾下滑鼠鍵即可設定人工評估工作流程。人工評估工作流程可以使用您自己的員工或 AWS 管理的團隊來作為審核者。模型評估提供內建的策劃資料集,您也可以使用自有資料集。
現在,客戶可以透過自訂模型匯入功能來評估自己匯入至 Amazon Bedrock 的模型。這可讓客戶完成選擇基本模型、自訂、評估的循環過程,並在需要時再次自訂,或者在對評估結果滿意時繼續生產。若要評估匯入的模型,只需在建立評估工作時,從模型選取器工具要評估的模型清單中選取自訂模型即可。
Amazon Bedrock 上的模型評估功能現已在這些商業區域和 AWS GovCloud (美國西部) 正式上市。
若要進一步了解 Amazon Bedrock 上的模型評估,請參閱 Amazon Bedrock 開發人員體驗網頁。若要開始使用,請在 AWS 管理主控台上登入 Amazon Bedrock,或使用 Amazon Bedrock API。