在制造业呼叫中心场景下,企业的客服和工程师无法有效利用已有的维修手册和历史故障案例,以帮助他们进行快速的设备维保。为了解决这些挑战,亚马逊云科技构建大语言模型赋能下的维修知识库解决方案指南,此使工程师能够使用日常语言查询具体问题,并快速获得详细的指导和建议。这不仅显著提高了维修效率和准确性,还大幅度缩短了设备的停机时间,并优化了整体运维成本。同时,该系统还支持维修人员的持续培训和技能发展,进一步提升了维修团队的专业水平。该指南基于 Amazon Bedrock 提供的第三方模型 Claude 3 和 Amazon OpenSearch 等服务构建。
典型应用场景
构建装备维护知识库和问答系统
使用历史维保记录和维修手册构建企业知识库,维修人员可依靠该知识库,进行快速问题定位和维修。
构建 IT/HR 系统智能问答系统
使用企业内部 IT/HR 使用手册构建企业知识库,企业内部员工可通过该知识库快速解决在 IT/HR 上遇到的问题。
构建电商平台的搜索和问答系统
使用商品信息构建商品数据库,消费者可通过检索+问答的方式快速了解商品的详细信息。
构建游戏社区自动问答系统
使用游戏的信息(例如游戏介绍,游戏攻略等)构建社区知识库,可给予知识库自动回复社区成员提供的问题。
构建智能客服聊天机器人系统
通过与呼叫中心/聊天机器人服务结合,可自动基于企业知识库就客户提出的问题进行聊天回复。
该平台将包括五大核心内容
智能搜索
智能引导
使用人工打标、无监督聚类、有监督分类、大语言模型 (LLM) 等方法提取引导词。使用引导词或者多轮对话的方式引导用户丰富搜索输入内容。
多模态数据
智能问答
任务编排(Agent)
方案优势
简单易用
轻量化插件
方案中的各个模块即可作为服务独立使用,也可作为插件与其他服务结合。
丰富的模型仓库
功能组件快速拓展
架构图
第 1 步
终端用户通过托管在 AWS Amplify 的网站输入查询请求或提交结果反馈。
第 2 步
网站将查询请求或结果反馈传递给 Amazon API Gateway,并从 API Gateway 接收响应。
第 3 步
API Gateway 将查询请求传递给搜索和问答组件。该组件由集成了 Langchain (开源框架) 的 AWS Lambda,具有搜索功能的 Amazon OpenSearch Service 或 Amazon Kendra ,以及 Amazon SageMaker 构成。
Lambda 首先从搜索引擎 (OpenSearch 或 Amazon Kendra) 获取搜索结果。随后Lambda 输入提前预置好的提示词。
这个过程使用到大语言模型 (LLM) 赋能的检索增强生成 (RAG) 技术。大语言模型托管在 Amazon Bedrock 或 SageMaker 端点上,API Gateway 用于向用户返回 LLM 建议的答案。
第 4 步
该方案还可以与 Amazon Connect 和 Amazon Lex 的人工智能 (AI) 机器人组件集成,使用户可以通过移动客户端进行提问并获得答复。
第 5 步
Amazon Connect 将用户语音转换为文本,并将其发送给 Amazon Lex。Amazon Lex 将查询请求传递给搜索和问答组件,以与第 3 步相同的方式获取建议的答案。
第 6 步
API Gateway 将反馈传递给搜索优化组件,该组件包含 Lambda、Amazon DynamoDB 和 Amazon EventBridge。Lambda 函数将结果反馈写入 DynamoDB,以帮助调整下一步中的模型。
第 7 步
EventBridge 调用存储在 DynamoDB 中的反馈数据训练 Extreme Gradient Boosting (XGBoost) 模型。训练后的模型将被部署到搜索引擎中。
第 8 步
Lambda 函数从 Amazon Simple Storage Service (Amazon S3) 读取原始文件。它将数据分块、embedding 并注入到搜索引擎中。embedding 模型托管在 SageMaker 端点上。这一步用来为搜索引擎构建知识库。
Well-Architected 支柱
当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。该框架的六大支柱让你能够学习设计和运行可靠、安全、高效、成本效益和可持续系统的架构最佳实践。使用 AWS 管理控制台中提供的免费 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。
上面的架构图是基于 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
-
卓越运营
该指南中使用的所有服务, 如 Lambda 和 API 网关,都提供了Amazon CloudWatch 指标,用于监控指南的各个组件。API 网关和 Lambda 允许通过自动化管道发布新版本。Amazon Connect、Amazon Lex 和 Amazon Kendra 也提供了 CloudWatch,可实现这些服务的监控、指标收集和性能分析。
-
安全性
AWS Identity and Access Management(AWS IAM)在本指南中用于控制对资源和数据的访问。API网关通过为调用的服务提供一个出站API的保护层来帮助提高安全性。它充当了客户端和后端服务之间的网关或代理,允许你控制访问并实施安全措施。
-
可靠性
该指南中使用的服务有Lambda、DynamoDB、Amazon S3和SageMaker。这些服务在同一个区域内提供高可用性,并允许部署高可用的SageMaker端点。我们利用这些服务通过确保依赖关系的松耦合、控制流量和访问次数限制以及保持无状态计算能力,从而实现可靠的应用程序级架构。
-
性能效率
该指南需要近实时推理和高并发性。Lambda、DynamoDB 和 API Gateway 的设计正是为满足这些标准。另外,我们使用 SageMaker 将大语言模型托管为端点或者使用Bedrock的大语言模型服务。Amazon Kendra 和 OpenSearch 是检索增强生成 (RAG) 概念的理想服务。RAG 结合了基于检索的模型和语言生成,以改进生成的文本。Amazon Kendra 和 OpenSearch 被用于高效的知识检索。这种架构使系统能够利用检索到的信息生成更准确、更具语境相关性的文本。
-
成本优化
该指南使用 Lambda 来设计搜索和问答的所有计算组件,计费方式是按每毫秒付费。数据存储使用 DynamoDB 和 Amazon S3 来设计,为存储和检索数据提供了较低的总成本。该指南还使用了 API 网关,减少了 API 开发时间,并帮助您确保只在调用 API 时才付费。
-
可持续性
这份指南利用 Lambda、SageMaker 推理端点和 API Gateway 的自动扩缩容行为来减少过度配置资源。像 Lambda 和 API Gateway 这样的无服务器服务只在有用户查询时才会被调用。它使用 AWS Managed Services(AMS)来最大化资源利用率,并减少运行给定工作负载所需的能源。Amplify、Amazon Connect 和 Amazon Lex 利用自动扩缩容能力来持续匹配负载并相应地分配资源。通过根据需求动态调整资源水平,这些服务能确保只使用最少必需的资源,优化效率和成本效益。
免责声明
示例代码、软件库、命令行工具、概念验证、模板、或其他相关技术(包括由我们的人员提供的任何前述内容)是根据 AWS 客户协议或您与 AWS 之间的相关书面协议(以适用者为准)向您提供的 “AWS 内容”。您不应在您的生产账户、生产或其他关键数据上使用该 “AWS 内容”。您负责根据您自己的质量控制实践和标准来测试、保护和优化 “AWS 内容”(如示例代码),以满足生产级别的使用要求。部署 AWS 内容可能会因创建或使用 AWS 收费资源(如运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。