Amazon Bedrock 模型评估现已在 AWS GovCloud（美国西部）区域推出

发布于: 2024年9月30日

借助 Amazon Bedrock 上的模型评估，您可以为您的应用场景评估、比较和选择最佳基础模型。Amazon Bedrock 提供了自动评估和人工评估选项。您可以将带有预定义算法的自动评估用于准确性、稳定性和毒性等指标。模型评估提供内置的精选数据集，或者您可以自带数据集。

Amazon Bedrock 的交互式界面可引导您完成模型评估。您只需选择自动评估，选择任务类型和指标，然后上传提示数据集即可。然后，Amazon Bedrock 会进行评估并生成报告，因此您可以轻松了解模型针对您所选指标的表现，并为您的应用场景选择合适的模型。将此报告与 Amazon Bedrock 中的成本和延迟指标相结合，您可以根据所需的质量、成本和延迟权衡来选择模型。

除了许多商业区域外，Amazon Bedrock上的模型评估现在也已在 AWS GovCloud（美国西部）正式发布。

要了解有关 Amazon Bedrock 上的模型评估的更多信息，请参阅 Amazon Bedrock 开发人员体验网页。要开始使用，请在 AWS 管理控制台上登录 Amazon Bedrock 或使用 Amazon Bedrock API。

选择您的 Cookie 首选项

Amazon Bedrock 模型评估现已在 AWS GovCloud（美国西部）区域推出

终止对 Internet Explorer 的支持