Amazon Bedrock 模型评测现已在欧洲(苏黎世)推出

发布于: 2024年12月9日

借助 Amazon Bedrock 上的模型评估,您可以为您的应用场景评估、比较和选择最佳基础模型。Amazon Bedrock 提供了使用 LLM-as-a-judge、程序化评测和人工评测的选项。您可以使用 LLM-as-a-judge 来评判正确性、完整性和一致性等指标,以及拒绝回答和危害性等响应式 AI 指标。程序化评测提供用于准确性、稳定性和毒性等指标的算法。此外,对于那些指标或主观和自定义指标(例如友好度或风格),您只需单击几下即可设置人工评测工作流程。人工评测可利用您自己的员工或 AWS 管理的团队作为评审者。模型评估提供内置的精选数据集,或者您可以自带数据集。现在,客户可以在欧洲(苏黎世)评测模型。

Amazon Bedrock 上的模型评测现已在这些区域推出,评测类型的可用性因区域而异。

要了解有关 Amazon Bedrock 上的模型评测的更多信息,请参阅 Amazon Bedrock 评测页面。要开始使用,请在 AWS 管理控制台上登录 Amazon Bedrock 或使用 Amazon Bedrock API。