本指南演示在 Amazon SageMaker JumpStart 中使用检索增强生成(RAG)和基础模型来回答问题。生成式人工智能由大型语言模型(LLM)提供支持,这些模型通常称为基础模型,已基于大量数据进行预训练。本指南介绍如何使用 Amazon SageMaker LLM 和嵌入端点来解决问答任务,以便您可以构建基于特定企业数据(而非通用数据)生成文本的模型。这可以帮助您自动执行任务、增强应用程序,并改进信息检索。

请注意:[免责声明]

架构图

下载架构图 PDF 

Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。

上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。

  • 本指南中的服务通过自动执行任务、提高安全性、增强可扩展性以及简化生成式人工智能应用程序的管理和运营,共同支持卓越运营。例如,SageMaker JumpStart 可简化机器学习(ML)模型部署,API Gateway 可提供安全、可扩展的 API 访问,Lambda 可自动执行处理并设置响应格式,OpenSearch Service 可改进数据检索,而 Fargate 可自动为索引作业预置资源。

    阅读《卓越运营》白皮书 
  • Amazon Cognito 有助于确保只有经过身份验证和授权的用户才能访问应用程序。它通过多重身份验证(MFA)选项管理用户身份。Amazon Virtual Private Cloud(Amazon VPC)将资源(例如 SageMaker 端点和 Lambda 函数)隔离在私有网络中。这种隔离可保护应用程序组件之间的通信,增强数据隐私和安全性。Amazon VPC 还允许实施网络安全措施,例如安全组和网络访问控制列表(NACL)。这些服务可帮助您保护敏感数据,保持应用程序的机密性、完整性和可用性。

    阅读《安全性》白皮书 
  • SageMaker JumpStart 可简化机器学习模型的部署和管理,包括模型版本控制和监控。这种简化可降低出现模型部署错误的风险,并有助于确保模型始终可用且在推理过程中保持可靠。此外,Lambda 函数可处理用户输入并调用 SageMaker 端点。Lambda 是无服务器服务,可自动处理扩展和可用性,确保应用程序能够可靠地处理用户请求,而无需手动扩展或管理服务器。 

    Fargate 负责启动为嵌入编制索引的作业,自动预置资源和管理容器,从而可靠地大规模完成索引作业。这种自动化可降低索引过程中出现资源限制或故障的风险。

    阅读《可靠性》白皮书 
  • 在任务可能涉及复杂的机器学习推理、数据处理和检索的生成式人工智能应用程序中,效率对于提供响应快速、性能优越的用户体验至关重要。通过使用 SageMaker JumpStartLambdaOpenSearch ServiceFargate,本指南可以高效地管理工作负载、缩短响应时间,并通过扩展来满足性能需求,最终通过提高应用程序的响应能力和效率来增强用户体验。

    SageMaker JumpStart 可优化模型部署和监控,从而高效启动机器学习推理,实现更快的响应速度并为用户提供更好的性能。Lambda 函数可自动扩展以处理并发请求,即使在用户需求旺盛的时期,应用程序也能保持性能效率。OpenSearch Service 可为嵌入编制索引并对其进行搜索,从而增强应用程序的信息检索能力,使用户能够快速访问所需的信息。Fargate 负责为嵌入调用索引作业。它可以自动预置资源,使应用程序无需手动干预即可对大量数据进行高效地处理及为其编制索引。

    阅读《性能效率》白皮书 
  • SageMaker JumpStart 提供预构建的机器学习模型和工作流程,可减少从头开始开发和训练模型所需的时间和资源。这可以通过加快开发周期来节省成本。Lambda 遵循即用即付定价模式,这意味着您只需为调用函数时使用的计算时间付费。OpenSearch Service 允许您根据搜索和分析工作负载轻松扩展集群。您可以通过调整资源以匹配实际使用量来优化成本。Fargate 可自动管理底层基础设施,因此您无需预置或管理服务器。这样就无需为未使用的服务器容量付费,从而节省了成本。 

    阅读《成本优化》白皮书 
  • LambdaSageMakerFargate 等服务通过优化资源使用来促进可持续发展。它们根据工作负载需求自动扩展资源,从而在低活动期间减少不必要的能耗。例如,作为无服务器计算基础设施,Fargate 运行容器化应用程序工作负载,并最大限度地减少您的总体资源占用。同样,SageMaker JumpStart 通过自动调整计算资源来满足工作负载需求,帮助防止资源过度预置而处于闲置状态。

    阅读《可持续性》白皮书 

实施资源

示例代码为起点。它经过行业验证,是规范性但不是决定性的,可以帮助您开始。

机器学习
博客

Question answering using Retrieval Augmented Generation with foundation models in Amazon SageMaker JumpStart

此博客文章介绍了 RAG 及其优势,并演示了如何使用示例笔记本快速入门,在 Jumpstart 中使用 LLM 实现 RAG,以解决问答任务。

免责声明

示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。

本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。

此页内容对您是否有帮助?