亚马逊AWS官方博客

Category: Generative AI

Amazon Bedrock 多 IAM 用户的成本追踪和控制方案助力 AI Character 最佳实践

在本篇博客文章中,我们将深入探讨如何利用 CloudWatch 近乎实时地监控 Bedrock 的运行状况。本文设定用户场景,企业级用户使用多个 IAM 用户来使用 Bedrock,管理人员准实时监控每个 IAM 用户的 Token 数,超过阈值的时候剥夺该 IAM 用户的 Bedrock 权限,从而实现对单个 IAM 用户的精细成本管控,避免因为不当使用大语言模型而造成潜在的巨大成本损失。

使用优化型读取和 pgvector,提高 Amazon Aurora 上生成式人工智能工作负载的性能

生成式人工智能为企业带来了更多的机会,可以利用向量搜索技术,实现对非机构化数据的搜索和比较。本文将阐述如何在 Amazon Aurora PostgreSQL 兼容版本中使用 pgvector 来实现向量搜索,以及如何利用 Aurora 优化型读取特性来提升向量搜索的性能表现。