Amazon Bedrock 模型評估現已在 AWS GovCloud (美國西部) 區域提供
Amazon Bedrock 上的模型評估可讓您評估、比較並為使用案例選擇最佳基礎模型。Amazon Bedrock 提供自動評估和人工評估選項。您可以使用具有準確性、穩健性和毒性等預先定義演算法的指標來自動評估。模型評估提供內建的策劃資料集,您也可以使用自有資料集。
Amazon Bedrock 的互動式介面會引導您完成模型評估。您只需選擇自動評估、選擇任務類型和指標,然後上傳提示資料集。然後 Amazon Bedrock 會執行評估並產生報告,您就可以輕鬆了解模型在您選擇的指標上的表現,並選擇最適合您的使用案例的模型。將此報表與 Amazon Bedrock 中的成本和延遲指標結合使用,您可以選擇具有所需品質、成本和延遲權衡的模型。
除了許多商業區域之外,Amazon Bedrock 上的模型評估現已在 AWS GovCloud (美國西部) 正式上市。
若要進一步了解 Amazon Bedrock 上的模型評估,請參閱 Amazon Bedrock 開發人員體驗網頁。若要開始使用,請在 AWS 管理主控台上登入 Amazon Bedrock,或使用 Amazon Bedrock API。