[SEO 副标题]
本指南展示了如何使用 AWS 及其合作伙伴提供的最新 AI 工具来构建高级问答应用程序。架构中包含了用于存储操作数据嵌入和向量数据嵌入的数据库服务。完全托管的生成式人工智能服务会创建此类嵌入,然后根据嵌入与查询向量的邻近度,将其与最相关的文档一起存储和管理。这种技术称为检索增强生成(RAG),可增强人工智能响应的准确性和相关性。借助这种技术,您可以利用自己的数据,更快解答客户的问题。
注意:[免责声明]
Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
-
卓越运营
Amazon Bedrock 和 Amazon DocumentDB 与 Amazon CloudWatch 和 AWS CloudTrail 进行集成,提供全面的监控、日志记录和可见性方法。借助这项集成,您可以跟踪 API 活动、监控模型使用指标和令牌消耗,还能访问 Amazon Bedrock 与性能相关的其他数据。您可以查看 Amazon DocumentDB 集群的 40 多项关键操作指标,包括计算、内存、存储、查询吞吐量、MongoDB 操作计数和活动连接。
-
安全性
Amazon DocumentDB 采用全面的加密和访问控制措施,将安全放在首位。它使用 AWS Key Management Service(AWS KMS)密钥来加密静态数据,并使用 TLS 来保护传输中数据。作为仅限虚拟私有云(VPC)的服务,Amazon DocumentDB 使用 Amazon Virtual Private Cloud(Amazon VPC)进行网络隔离和访问控制。基于角色的访问控制(RBAC)支持最低权限访问,而 AWS Identity and Access Management(IAM)策略提供了对用户操作和资源访问的精细控制。为了加强对敏感信息的保护,您可以实施客户端字段级加密(CS-FLE),CS-FLE 使用 AWS KMS 有选择地加密个人身份信息(PII)等数据。此外,Amazon DocumentDB 将日志数据存储在 CloudWatch 中,有利于实现全面的审计功能。
-
可靠性
Amazon DocumentDB 提供了战略部署和强大的备份功能。通过在三个可用区(AZ)上部署集群,Amazon DocumentDB 确保即使面临潜在故障,也能持续运行。多可用区集群设计保障了高可用性,无需手动干预即可在不到 30 秒的时间内完成对现有副本的自动失效转移。Amazon DocumentDB 的内置备份功能默认处于启用状态,支持集群的时间点恢复,允许恢复到指定保留期内的任意一秒钟。此功能显著降低了数据丢失的风险,并最大限度地减少了停机时间。此外,Amazon Bedrock 采用无服务器架构,消除了基础设施管理问题,通过减少潜在故障点和简化操作,进一步提高了本指南所述做法的整体可靠性。
-
性能效率
本指南使用了 Amazon DocumentDB 的向量搜索功能,提供了微调查询参数的机制。初始配置使用了针对向量搜索查询的优化设置,但您也可根据工作负载流量和查询性能要求,进一步调整探测器或 efSearch 参数。增加探测器或 efSearch 值可以提高召回率,但会降低速度,因此对于探测器参数,您可以尝试推荐的起始设置,也就是列表数量的平方根 sqrt(# of lists)。为了帮助确保集群能够应对工作负载峰值并满足性能服务等级协议(SLA),本指南依靠 Amazon CloudWatch Logs 和 Amazon DocumentDB 性能详情,根据需要对集群进行水平和纵向的监控和扩展。同样,Amazon Bedrock 与 CloudWatch 集成,提供对 API 活动、模型使用指标、令牌消耗和其他性能相关数据的全面监控、日志记录和可见性。
-
成本优化
Amazon DocumentDB 提供灵活且可扩展的架构,可根据工作负载需求,自动扩展存储和 I/O,因此您只需为实际使用的资源付费。Amazon DocumentDB 提供标准型和 I/O 优化型存储配置,允许您根据特定的工作负载要求选择最具成本效益的选项。为了进一步优化成本,您可以使用 CloudWatch 来监控资源消耗,为有关扩展的决策或存储配置的选择提供依据。通过将这些选项结合在一起,您可以根据自己的特定需求和使用模式,更好地平衡成本和性能,避免不必要的长期投入并节省成本,从而获得更稳定的工作负载。
-
可持续性
灵活扩展和节能硬件的结合,显著增强了架构的可持续性。例如,Amazon DocumentDB 的水平扩缩功能允许精确调整资源,根据需要进行横向缩减和扩展。这种方法可以优化资源使用,最大限度地减少浪费,并减少不必要的能耗。此外,Amazon DocumentDB 提供 AWS Graviton 实例,可在提高性能的同时降低能耗。Amazon Bedrock 的无服务器架构再添助力,使您无需管理基础设施,从而减少了潜在的资源浪费。
免责声明
示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。
本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指南是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。