本指南演示了如何使用 NetApp BlueXP Workload Factory for AWS,这是一种软件即服务(SaaS)框架,可将适用于 NetApp ONTAP 的 Amazon FSx 数据卷与 Amazon Bedrock 连接起来。它提供了实施检索增强生成(RAG)工作流的分步说明,有助于 AWS 客户创建根据其知识库提供自定义回复的聊天机器人。用户还可以将数据嵌入与 Amazon Bedrock 集成的向量数据库,从非结构化企业数据中揭示有价值的见解。本指南为优化各种应用(包括 RAG 聊天机器人和 SQL 部署助手)的生成人工智能(AI)功能提供了一条安全、有效的途径。
请注意:[免责声明]
架构图
[架构图描述]
第 1 步
用户将 NetApp BlueXP Workload Factory for AWS 应用程序部署到他们的 AWS 账户中,并在 Amazon Elastic Compute Cloud(Amazon EC2)实例上运行。
第 2 步
NetApp BlueXP Workload Factory for AWS 连接到位于适用于 NetApp ONTAP 的 Amazon FSx 中的指定源数据卷(Data 1、Data 2)。
这些数据可能来自本地,也可能来自 AWS 云。NetApp BlueXP Workload Factory for AWS 监控源数据更新(例如添加的新文件)并提取这些数据更改。
第 3 步
用户选择 NetApp BlueXP Workload Factory for AWS 支持的可用大型语言模型(LLM),供 Amazon Bedrock 用于生成响应。
第 4 步
NetApp BlueXP Workload Factory for AWS 使用 Amazon Bedrock 中的 Amazon Titan LLM 启动嵌入流程。
第 5 步
NetApp BlueXP Workload Factory for AWS Lance DB 开源向量数据库(DB)组件在 Amazon EC2 上运行。该组件将从 Amazon Bedrock 收到的向量嵌入存储在适用于 ONTAP 的 FSx 内的向量 DB 存储中。
第 6 步
用户使用 Auth0 通过 NetApp BlueXP Workload Factory for AWS 应用程序用户界面(UI)向 Microsoft Active Directory 域服务进行身份验证。
第 7 步
用户向 NetApp BlueXP Workload Factory for AWS 聊天机器人应用程序发送文本提示。
第 8 步
根据用户的提示,NetApp BlueXP Workload Factory for AWS 聊天机器人从存储在可访问数据卷(Data1、Data2)中的文档中检索检索增强生成(RAG)向量数据。
第 9 步
NetApp BlueXP Workload Factory for AWS 组件使用 Amazon Bedrock 根据相关 LLM 与 RAG 结合的结果生成响应。然后,它通过其用户界面向用户显示响应。
开始使用
Well-Architected 支柱
当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
-
卓越运营
适用于 ONTAP 的 FSx 提供弹性、高性能存储,具有诸如从本地阵列复制数据等企业功能,支持数据完整性和可用性。Amazon Bedrock 通过提供对预训练模型的访问来加速生成式人工智能应用程序的开发,而 Amazon EC2 则提供安全的云计算容量。此集成支持使用 NetAPP SnapMirror(一种可以快速将快照数据复制到一个或多个存储系统的软件)将数据从本地复制到 AWS。
-
安全性
适用于 ONTAP 的 FSx、Amazon Bedrock 和 AWS Identity and Access Management(IAM)提供全面的安全性和增强的用户管理功能。适用于 ONTAP 的 FSx 是一种托管文件存储服务,提供静态和传输加密,以及 HIPAA 和 FedRAMP 等合规性认证。Amazon Bedrock 与各种 AWS 安全服务集成,以确保在应用程序中使用基础模型;它还支持传输中的数据加密,并使用户能够完全控制其数据。IAM 强制实施细粒度的访问控制,允许管理员实施最低权限原则。
最后,作为在用户账户内运行的独立软件供应商(ISV)应用程序,此指南可防止用户环境中的数据泄露。这些服务与 IAM 基于身份的策略相结合,可提供全面的安全措施和增强的用户管理功能。
-
可靠性
适用于 ONTAP 的 FSx 通过多个可用区(AZ)部署选项支持高可用性,并提供强大的数据保护功能(包括 NetApp ONTAP 快照和与 AWS Backup 的集成),从而支持数据持久性和可用性。作为一项托管 AWS 服务,Amazon Bedrock 利用 AWS 在管理复杂 AI 基础设施方面的专业知识来降低停机风险并保持稳定的性能。本指南安装在 Amazon EC2 上,可在实例维护期间轻松重启或重建系统。
-
性能效率
适用于 ONTAP 的 FSx 具有较高的性能,它通过固态硬盘(SSD)支持活动数据,并使用 SnapMirror 和 FlexCache 来改善本地和 AWS 环境之间的数据移动性。Amazon Bedrock 使用户无需管理复杂的基础设施即可访问基础模型。本指南安装在 Amazon EC2 上,与 AWS Nitro System(一种支持高性能工作负载的轻量级虚拟机管理程序)集成。此服务组合可提高从实验到全面生产部署的性能效率。
-
成本优化
适用于 ONTAP 的 FSx 提供重复数据删除和压缩等数据效率功能,同时将较冷的数据分层到容量池中,这样可以降低存储成本。Amazon Bedrock 可帮助用户避免构建和训练自定义模型的昂贵过程,从而显著降低开发成本。本指南还充分利用硬件资源进行计算、网络和 I/O 加速,从而为用户节省成本。适用于 ONTAP 的 FSx 的效率功能可直接降低存储成本,而存储成本通常是生成式人工智能应用程序成本中占比较大的部分。作为一项托管服务,Amazon Bedrock 可简化 AI 模型的开发和部署流程,从而进一步降低相关成本。最后,Amazon EC2 灵活的定价选项(包括节省计划、按需型实例和预留实例)为成本优化提供了更多途径。
-
可持续性
为本指南选择的服务是针对其各自工作负载的最佳服务,在效率和可持续性之间实现了平衡。通过使用原生 AWS 托管服务,用户可以受益于 AWS 对可持续性的持续承诺,其中包括对可再生能源和高效数据中心设计的投资。与在本地运行类似工作负载或使用优化程度较低的云解决方案相比,这种方法使组织能够减少碳足迹。使用这些托管服务还意味着可以更有效地在多个客户之间共享和利用资源,从而可能实现整体节能和更可持续的 IT 基础设施。
相关内容
免责声明
示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。
本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。