Amazon Bedrock 扩展了对请求级使用量归因的支持

发布于: 2026年5月20日

Amazon Bedrock 客户现在可通过 InvokeModel 和 InvokeModelWithResponseStream API,在单个请求级别将模型推理使用量归因于特定团队、应用程序、环境和实验。这使客户能够详细了解组织内的 Amazon Bedrock 使用量分布情况,从而更好地
理解消费模式、优化支出,无需预置其他资源即可向内部利益相关者报告使用情况。

此次发布依托 Amazon Bedrock 现有的使用量归因功能组合。客户已能使用以下各项在资源和身份级别对模型推理使用量进行归因:应用程序推理配置文件、基于 IAM 主体的归因、兼容 OpenAI 的 bedrock-mantle 端点上的项目级跟踪,以及针对 Anthropic Claude 模型的
工作区级跟踪。Converse 和 ConverseStream API 自推出以来便支持请求级元数据,可实现更精细的每请求归因。今天发布的版本为 InvokeModel 和 InvokeModelWithResponseStream API 引入了相同的功能,使客户能够通过一致的方式,为整个 bedrock-runtime 端点上的推理调用添加标签。

通过此次发布,客户可以使用团队、项目或环境等属性为每次 Amazon Bedrock 模型推理调用添加标签,并在 Amazon Bedrock 模型调用日志中按这些标签分析使用情况。要开始使用,请在您调用 Amazon Bedrock 的 AWS 区域中启用模型调用日志记录,然后向推理请求添加元数据。此功能已在提供 Amazon Bedrock 的所有 AWS 商业区域推出。要了解更多信息,请参阅请求元数据。