下一代智能搜索和知识库解决方案指南

在制造业呼叫中心场景下，企业的客服和工程师无法有效利用已有的维修手册和历史故障案例，以帮助他们进行快速的设备维保。为了解决这些挑战，亚马逊云科技构建大语言模型赋能下的维修知识库解决方案指南，此使工程师能够使用日常语言查询具体问题，并快速获得详细的指导和建议。这不仅显著提高了维修效率和准确性，还大幅度缩短了设备的停机时间，并优化了整体运维成本。同时，该系统还支持维修人员的持续培训和技能发展，进一步提升了维修团队的专业水平。该指南基于 Amazon Bedrock 提供的第三方模型 Claude 3 和 Amazon OpenSearch 等服务构建。

典型应用场景

构建装备维护知识库和问答系统

使用历史维保记录和维修手册构建企业知识库，维修人员可依靠该知识库，进行快速问题定位和维修。

构建 IT/HR 系统智能问答系统

使用企业内部 IT/HR 使用手册构建企业知识库，企业内部员工可通过该知识库快速解决在 IT/HR 上遇到的问题。

构建电商平台的搜索和问答系统

使用商品信息构建商品数据库，消费者可通过检索+问答的方式快速了解商品的详细信息。

构建游戏社区自动问答系统

使用游戏的信息（例如游戏介绍，游戏攻略等）构建社区知识库，可给予知识库自动回复社区成员提供的问题。

构建智能客服聊天机器人系统

通过与呼叫中心/聊天机器人服务结合，可自动基于企业知识库就客户提出的问题进行聊天回复。

该平台将包括五大核心内容

智能搜索

以 Amazon OpenSearch 和 Amazon Kendra 为基础构建搜索引擎。提供分词搜索，模糊查询和 AI/ML 辅助搜索功能。

智能引导

使用人工打标、无监督聚类、有监督分类、大语言模型 (LLM) 等方法提取引导词。使用引导词或者多轮对话的方式引导用户丰富搜索输入内容。

多模态数据

支持常用非结构化文本（例如 PDF，Word），表格（例如 Excel, CSV）, 常用结构化数据库（例如 SQL）构建企业知识库，支持图片，视频等多模态数据。

智能问答

基于搜索内容和大语言模型 (LLM) ，直接给出问题答案。

任务编排（Agent）

利用 LLM 构建 Agent，通过任务编排实现意图识别和全自动调用工具链。

方案优势

简单易用

基于 CDK 的部署代码可快速部署涵盖前后端完整服务的 Demo 环境，并提供 API 调用方式。

轻量化插件

方案中的各个模块即可作为服务独立使用，也可作为插件与其他服务结合。

丰富的模型仓库

可通过 Bedrock 使用包括 Claude 3 在内的 LLM，通过 Sagemaker Endpoint 和 EC2/EKS 部署开源或者自研模型，也可接入合作伙伴提供的模型 SaaS 服务。

功能组件快速拓展

通过拓展组件能够快速实现，包括语音 / 视频 / 图片 / 文本在内的多维度数据搜索问答并实现端到端的服务。

架构图

下载架构图 PDF

第 1 步
终端用户通过托管在 AWS Amplify 的网站输入查询请求或提交结果反馈。

第 2 步
网站将查询请求或结果反馈传递给 Amazon API Gateway，并从 API Gateway 接收响应。

第 3 步
API Gateway 将查询请求传递给搜索和问答组件。该组件由集成了 Langchain (开源框架) 的 AWS Lambda，具有搜索功能的 Amazon OpenSearch Service 或 Amazon Kendra ，以及 Amazon SageMaker 构成。

Lambda 首先从搜索引擎 (OpenSearch 或 Amazon Kendra) 获取搜索结果。随后Lambda 输入提前预置好的提示词。

这个过程使用到大语言模型 (LLM) 赋能的检索增强生成 (RAG) 技术。大语言模型托管在 Amazon Bedrock 或 SageMaker 端点上，API Gateway 用于向用户返回 LLM 建议的答案。

第 4 步
该方案还可以与 Amazon Connect 和 Amazon Lex 的人工智能 (AI) 机器人组件集成，使用户可以通过移动客户端进行提问并获得答复。

第 5 步
Amazon Connect 将用户语音转换为文本，并将其发送给 Amazon Lex。Amazon Lex 将查询请求传递给搜索和问答组件，以与第 3 步相同的方式获取建议的答案。

第 6 步
API Gateway 将反馈传递给搜索优化组件，该组件包含 Lambda、Amazon DynamoDB 和 Amazon EventBridge。Lambda 函数将结果反馈写入 DynamoDB，以帮助调整下一步中的模型。

第 7 步
EventBridge 调用存储在 DynamoDB 中的反馈数据训练 Extreme Gradient Boosting (XGBoost) 模型。训练后的模型将被部署到搜索引擎中。

第 8 步
Lambda 函数从 Amazon Simple Storage Service (Amazon S3) 读取原始文件。它将数据分块、embedding 并注入到搜索引擎中。embedding 模型托管在 SageMaker 端点上。这一步用来为搜索引擎构建知识库。

Well-Architected 支柱

当您在云中构建系统时，AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。该框架的六大支柱让你能够学习设计和运行可靠、安全、高效、成本效益和可持续系统的架构最佳实践。使用 AWS 管理控制台中提供的免费 AWS Well-Architected Tool，您可以通过回答每个支柱的一组问题，根据这些最佳实践来检查您的工作负载。

上面的架构图是基于 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构，您应该遵循尽可能多的 Well-Architected 最佳实践。

卓越运营

该指南中使用的所有服务, 如 Lambda 和 API 网关，都提供了Amazon CloudWatch 指标，用于监控指南的各个组件。API 网关和 Lambda 允许通过自动化管道发布新版本。Amazon Connect、Amazon Lex 和 Amazon Kendra 也提供了 CloudWatch，可实现这些服务的监控、指标收集和性能分析。

阅读卓越运营白皮书
安全性

AWS Identity and Access Management（AWS IAM）在本指南中用于控制对资源和数据的访问。API网关通过为调用的服务提供一个出站API的保护层来帮助提高安全性。它充当了客户端和后端服务之间的网关或代理，允许你控制访问并实施安全措施。

阅读安全白皮书
可靠性

该指南中使用的服务有Lambda、DynamoDB、Amazon S3和SageMaker。这些服务在同一个区域内提供高可用性，并允许部署高可用的SageMaker端点。我们利用这些服务通过确保依赖关系的松耦合、控制流量和访问次数限制以及保持无状态计算能力，从而实现可靠的应用程序级架构。

阅读可靠性白皮书
性能效率

该指南需要近实时推理和高并发性。Lambda、DynamoDB 和 API Gateway 的设计正是为满足这些标准。另外，我们使用 SageMaker 将大语言模型托管为端点或者使用Bedrock的大语言模型服务。Amazon Kendra 和 OpenSearch 是检索增强生成 (RAG) 概念的理想服务。RAG 结合了基于检索的模型和语言生成，以改进生成的文本。Amazon Kendra 和 OpenSearch 被用于高效的知识检索。这种架构使系统能够利用检索到的信息生成更准确、更具语境相关性的文本。

阅读性能效率白皮书
成本优化

该指南使用 Lambda 来设计搜索和问答的所有计算组件，计费方式是按每毫秒付费。数据存储使用 DynamoDB 和 Amazon S3 来设计，为存储和检索数据提供了较低的总成本。该指南还使用了 API 网关，减少了 API 开发时间，并帮助您确保只在调用 API 时才付费。

阅读成本优化白皮书
可持续性

这份指南利用 Lambda、SageMaker 推理端点和 API Gateway 的自动扩缩容行为来减少过度配置资源。像 Lambda 和 API Gateway 这样的无服务器服务只在有用户查询时才会被调用。它使用 AWS Managed Services（AMS）来最大化资源利用率，并减少运行给定工作负载所需的能源。Amplify、Amazon Connect 和 Amazon Lex 利用自动扩缩容能力来持续匹配负载并相应地分配资源。通过根据需求动态调整资源水平，这些服务能确保只使用最少必需的资源,优化效率和成本效益。

阅读可持续性白皮书

实施资源

该示例代码经过了行业客户的验证，具有一定的规范性，但是不建议直接应用于生产环境，仅供参考。

GitHub 上的开放示例代码

免责声明

示例代码、软件库、命令行工具、概念验证、模板、或其他相关技术（包括由我们的人员提供的任何前述内容）是根据 AWS 客户协议或您与 AWS 之间的相关书面协议（以适用者为准）向您提供的 “AWS 内容”。您不应在您的生产账户、生产或其他关键数据上使用该 “AWS 内容”。您负责根据您自己的质量控制实践和标准来测试、保护和优化 “AWS 内容”（如示例代码），以满足生产级别的使用要求。部署 AWS 内容可能会因创建或使用 AWS 收费资源（如运行 Amazon EC2 实例或使用 Amazon S3 存储）而产生 AWS 费用。