本指南为创建检索增强生成(RAG)应用程序(例如问答机器人)提供分步指南。通过结合使用 AWS 服务、开源基础模型以及 LangChain 和 Streamlit 等软件包,您可以创建企业级应用程序。基于 RAG 的方法使用相似性搜索为用户的查询提供背景信息,从而提高所提供答复的精确性和充分性。

请注意:[免责声明]

架构图

[架构图描述]

下载架构图 PDF 

Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。

上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。

  • 本指南通过自动执行任务以及提供可减少手动工作、提升系统可靠性和加强安全性的功能来增强卓越运营。SageMakerAPI GatewayLambdaOpenSearch Service 等 AWS 服务是完全托管的,因此您的开发团队无需处理服务器预置、修补和日常维护。此外,它们可以实现模型部署、代码实施、扩展和失效转移等方面的自动化,从而降低发生人为错误的可能性,并加快运营事件期间的响应速度。

    阅读《卓越运营》白皮书 
  • 本指南优先保障安全,保护用户数据和互动以及在用户之间建立信任。 SageMakerAPI GatewayOpenSearch Service 等服务会对数据进行加密,使未经授权的用户无法读取这些数据。API GatewayLambdaAWS Identity and Access Management(IAM)使您能够精确控制谁能访问系统以及他们能执行哪些操作,而 API GatewayOpenSearch Service 可提供身份验证,以防止未经授权的访问并避免潜在的安全问题。

    阅读《安全性》白皮书 
  • 本指南使用高可靠性服务,可确保您的系统对用户保持可用和可信。SageMakerLambdaOpenSearch Service 等 AWS 服务高度可用,能够自动扩展以应对更多用户需求而不会减慢速度,并使用内置的备份计划来保护您的数据免于丢失或损坏。此外,API GatewayLambda 等服务可以顺畅地处理错误,确保您的用户不会察觉到中断。

    阅读《可靠性》白皮书 
  • 本指南使用多项可自动执行设置模型、处理请求和适应变化等任务的服务。这使您的系统更加高效快捷,而无需大量的手动操作。SageMaker 可自动部署机器学习(ML)模型,从而提高应用程序的整体响应能力。API Gateway 可高效地管理传入的请求,最大限度地加快响应速度。Lambda 函数可自动扩展以处理各种不同的工作负载,而 OpenSearch Service 可提供快速准确的文档检索,从而使查找相似文档的过程变得快速而响应迅捷。

    阅读《性能效率》白皮书 
  • 本指南通过最大限度地减少资源使用量、采用高效的定价模式、减少维护开销以及优化数据处理来支持成本优化,最终降低运营成本。例如,SageMakerAPI GatewayLambda 会根据需求自动扩展和分配资源。SageMakerOpenSearch Service 之类的托管服务还可以减轻开发团队的运营负担,从而降低基础设施管理和维护的成本。此外,Lambda 提供即用即付定价模式,因此只有在函数实际处理请求时才向您收费,而 API Gateway 可以高效地处理请求和响应,从而减少通过网络传输的数据量。

    阅读《成本优化》白皮书 
  • 本指南使用了通过自动可扩展性支持可持续性的服务。LambdaAPI Gateway 等无服务器服务仅在被调用时使用计算资源,而 OpenSearch ServiceSageMaker 会自动扩展以满足您的工作负载需求。本指南可通过促进资源的高效利用,帮助您避免不必要的能源消耗并减少碳足迹。

    阅读《可持续性》白皮书 

实施资源

提供了在 AWS 账户中进行实验和使用的详细指南。构建指南的每个阶段(包括部署、使用和清理)都将被检查,以便为部署做好准备。

示例代码为起点。它经过行业验证,是规范性但不是决定性的,可以帮助您开始。

机器学习
博客

Build a powerful question-answering bot with Amazon SageMaker, Amazon OpenSearch Service, Streamlit, and LangChain

此博客文章提供了分步指南,其中包含创建企业级 RAG 应用程序(例如问答机器人)所需的所有构成要素。 
机器学习
示例代码

大型语言模型(LLM)和检索增强生成(RAG)

此示例代码演示了基于 RAG 的 LLM 驱动的问答机器人。

免责声明

示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。

本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。

此页内容对您是否有帮助?