AWS 上使用向量数据库的聊天机器人的指南

[SEO 副标题]

本指南为创建检索增强生成（RAG）应用程序（例如问答机器人）提供分步指南。通过结合使用 AWS 服务、开源基础模型以及 LangChain 和 Streamlit 等软件包，您可以创建企业级应用程序。基于 RAG 的方法使用相似性搜索为用户的查询提供背景信息，从而提高所提供答复的精确性和充分性。

请注意：[免责声明]

架构图

[架构图描述]

下载架构图 PDF

Guidance Architecture Diagram for Chatbots with Vector Databases on AWS

先决条件
Amazon SageMaker Processing 作业用于将大规模数据摄取到 Amazon OpenSearch Service。在此离线数据摄取步骤中，可将数据集本地下载到 SageMaker 笔记本，然后将其提取到 OpenSearch Service 索引中。将文档拆分为多个片段，然后可将其转换为嵌入内容，以便导入到 OpenSearch Service 服务。

Well-Architected 支柱

当您在云中构建系统时，AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool，您可以通过回答每个支柱的一组问题，根据这些最佳实践来检查您的工作负载。

上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构，您应该遵循尽可能多的 Well-Architected 最佳实践。

卓越运营

本指南通过自动执行任务以及提供可减少手动工作、提升系统可靠性和加强安全性的功能来增强卓越运营。SageMaker、API Gateway、Lambda 和 OpenSearch Service 等 AWS 服务是完全托管的，因此您的开发团队无需处理服务器预置、修补和日常维护。此外，它们可以实现模型部署、代码实施、扩展和失效转移等方面的自动化，从而降低发生人为错误的可能性，并加快运营事件期间的响应速度。

阅读《卓越运营》白皮书
安全性

本指南优先保障安全，保护用户数据和互动以及在用户之间建立信任。 SageMaker、API Gateway 和 OpenSearch Service 等服务会对数据进行加密，使未经授权的用户无法读取这些数据。API Gateway、Lambda 和 AWS Identity and Access Management（IAM）使您能够精确控制谁能访问系统以及他们能执行哪些操作，而 API Gateway 和 OpenSearch Service 可提供身份验证，以防止未经授权的访问并避免潜在的安全问题。

阅读《安全性》白皮书
可靠性

本指南使用高可靠性服务，可确保您的系统对用户保持可用和可信。SageMaker、Lambda 和 OpenSearch Service 等 AWS 服务高度可用，能够自动扩展以应对更多用户需求而不会减慢速度，并使用内置的备份计划来保护您的数据免于丢失或损坏。此外，API Gateway 和 Lambda 等服务可以顺畅地处理错误，确保您的用户不会察觉到中断。

阅读《可靠性》白皮书
性能效率

本指南使用多项可自动执行设置模型、处理请求和适应变化等任务的服务。这使您的系统更加高效快捷，而无需大量的手动操作。SageMaker 可自动部署机器学习（ML）模型，从而提高应用程序的整体响应能力。API Gateway 可高效地管理传入的请求，最大限度地加快响应速度。Lambda 函数可自动扩展以处理各种不同的工作负载，而 OpenSearch Service 可提供快速准确的文档检索，从而使查找相似文档的过程变得快速而响应迅捷。

阅读《性能效率》白皮书
成本优化

本指南通过最大限度地减少资源使用量、采用高效的定价模式、减少维护开销以及优化数据处理来支持成本优化，最终降低运营成本。例如，SageMaker、API Gateway 和 Lambda 会根据需求自动扩展和分配资源。SageMaker 和 OpenSearch Service 之类的托管服务还可以减轻开发团队的运营负担，从而降低基础设施管理和维护的成本。此外，Lambda 提供即用即付定价模式，因此只有在函数实际处理请求时才向您收费，而 API Gateway 可以高效地处理请求和响应，从而减少通过网络传输的数据量。

阅读《成本优化》白皮书
可持续性

本指南使用了通过自动可扩展性支持可持续性的服务。Lambda 和 API Gateway 等无服务器服务仅在被调用时使用计算资源，而 OpenSearch Service 和 SageMaker 会自动扩展以满足您的工作负载需求。本指南可通过促进资源的高效利用，帮助您避免不必要的能源消耗并减少碳足迹。

阅读《可持续性》白皮书

实施资源

提供了在 AWS 账户中进行实验和使用的详细指南。构建指南的每个阶段（包括部署、使用和清理）都将被检查，以便为部署做好准备。

示例代码为起点。它经过行业验证，是规范性但不是决定性的，可以帮助您开始。

打开实施指南

GitHub 上的开放示例代码

相关内容

机器学习

示例代码

大型语言模型（LLM）和检索增强生成（RAG）

此示例代码演示了基于 RAG 的 LLM 驱动的问答机器人。

免责声明

示例代码；软件库；命令行工具；概念验证；模板；或其他相关技术（包括由我方人员提供的任何前述项）作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议（以适用者为准）向您提供。您不应将这些 AWS 内容用在您的生产账户中，或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容，例如示例代码，以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源（例如，运行 Amazon EC2 实例或使用 Amazon S3 存储）而产生 AWS 费用。

本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指南是一个技术起点，您可以在部署架构时自定义与第三方服务的集成。

此页内容对您是否有帮助？

反馈

配置文件

您的配置文件有助于改善您与精选 AWS 体验的交互。

登录

配置文件

您的配置文件有助于改善您与精选 AWS 体验的交互。

查看配置文件

退出

配置文件

您的配置文件有助于改善您与精选 AWS 体验的交互。

登录

配置文件

您的配置文件有助于改善您与精选 AWS 体验的交互。

查看配置文件

退出

配置文件

您的配置文件有助于改善您与精选 AWS 体验的交互。

查看配置文件

退出

选择您的 Cookie 首选项

AWS 上使用向量数据库的聊天机器人的指南

[SEO 副标题]

架构图

Well-Architected 支柱

实施资源

相关内容

大型语言模型（LLM）和检索增强生成（RAG）

免责声明

此页内容对您是否有帮助？

终止对 Internet Explorer 的支持