Amazon Bedrock 模型评测现已在欧洲（苏黎世）推出

发布于: 2024年12月9日

借助 Amazon Bedrock 上的模型评估，您可以为您的应用场景评估、比较和选择最佳基础模型。Amazon Bedrock 提供了使用 LLM-as-a-judge、程序化评测和人工评测的选项。您可以使用 LLM-as-a-judge 来评判正确性、完整性和一致性等指标，以及拒绝回答和危害性等响应式 AI 指标。程序化评测提供用于准确性、稳定性和毒性等指标的算法。此外，对于那些指标或主观和自定义指标（例如友好度或风格），您只需单击几下即可设置人工评测工作流程。人工评测可利用您自己的员工或 AWS 管理的团队作为评审者。模型评估提供内置的精选数据集，或者您可以自带数据集。现在，客户可以在欧洲（苏黎世）评测模型。

Amazon Bedrock 上的模型评测现已在这些区域推出，评测类型的可用性因区域而异。

要了解有关 Amazon Bedrock 上的模型评测的更多信息，请参阅 Amazon Bedrock 评测页面。要开始使用，请在 AWS 管理控制台上登录 Amazon Bedrock 或使用 Amazon Bedrock API。

选择您的 Cookie 首选项

Amazon Bedrock 模型评测现已在欧洲（苏黎世）推出

终止对 Internet Explorer 的支持