[SEO 副标题]
本指南演示了如何通过部署包括大型语言模型(LLM)在内的接口节点,构建基于企业知识库中信息的搜索应用程序。您可以将基于企业知识库的服务与提供分词搜索、模糊查询和人工智能(AI)辅助功能的搜索引擎相结合,为问题提供答案。本指南还包括手动标记、无监督集群、监督分类和用于提取指导词的 LLM 等方法。部署本指南可以帮助您将文档自动拆分为带有嵌入式向量的段落,以进一步建立结构化的企业知识库。
请注意:[免责声明]
Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
-
卓越运营
本指南中使用的所有服务,例如 Lambda 和 API Gateway,都提供了 Amazon CloudWatch 指标,它们可用于监控指南的各个组件。API Gateway 和 Lambda 允许通过自动管道发布新版本。CloudWatch 可用于 Amazon Connect、Amazon Lex 和 Amazon Kendra,支持对这些服务进行监控、指标收集和性能分析。
-
安全性
本指南使用 AWS Identity and Access Management(IAM)来控制对资源和数据的访问。API Gateway 通过出站 API 为调用类别服务提供保护层,从而帮助提高安全性。它充当客户端和后端服务之间的网关或代理,从而使您可以控制访问和实施安全措施。
-
可靠性
本指南中使用的服务包括 Lambda、DynamoDB、Amazon S3 和 SageMaker。这些服务在区域内提供高可用性,并允许部署高度可用的 SageMaker 端点。我们使用这些服务通过确保松散耦合的依赖关系、处理节流和重试限制以及维护无状态计算能力来实现可靠的应用程序级架构。
-
性能效率
本指南需要近乎实时的推理和高并发性。Lambda、DynamoDB 和 API Gateway 旨在满足此标准。此外,我们还使用 SageMaker 将 LLM 作为端点托管。Amazon Kendra 和 OpenSearch 是 RAG 概念的理想服务。RAG 将基于检索的模型和语言生成相结合,以改进生成的文本。Amazon Kendra 和 OpenSearch 用于高效的知识检索。这种架构使系统能够利用检索到的信息来生成更准确、更具有上下文相关性的文本。
-
成本优化
本指南使用 Lambda 来设计搜索和问答的所有计算组件,以按毫秒计费。数据存储使用 DynamoDB 和 Amazon S3 进行设计,为存储和检索数据提供了较低的总拥有成本。该指南还使用 API Gateway,它缩短了 API 开发时间,并帮助您确保仅在调用 API 时付费。
-
可持续性
本指南使用 Lambda、SageMaker 推理端点和 API Gateway 的扩缩行为来减少过度预调配资源。诸如 Lambda 和 API Gateway 之类的无服务器服务仅在有用户查询时才会调用。它使用 AWS Managed Services(AMS)来最大限度地提高资源利用率,并减少运行给定工作负载所需的能量。Amplify、Amazon Connect 和 Amazon Lex 利用自动扩缩功能来持续匹配负载并相应地分配资源。通过根据需求动态调整资源水平,这些服务可确保仅利用最低限度的必要资源,从而优化效率和成本效益。
免责声明
示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。
本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。