本指引将展示如何为智能产品构建安全、灵活的多租户人工智能(AI)训练平台。客户可以将您平台的训练数据和机器学习(ML)模型与他们自己的数据结合使用。这样就创建了一个多租户基础设施,因此提高了敏捷性和成本效益。通过在 AWS 上构建多租户训练环境,您可以保护平台的数据、算法和服务免遭未经授权的访问,同时帮助客户安全地维护单独的数据集。随后,您的平台可以编排自动化模型训练管道,并集成数据和工作流。最终,这样可以帮助您的客户缩短上市时间。

请注意:[免责声明]

架构图

[架构图描述]

下载架构图 PDF 

Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。

上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。

  • 本指引可以帮助您使用托管式服务减轻平台的运营负担。通过集成 SageMaker 软件开发工具包(SDK),您可以创建 Web 门户用户界面,以帮助您的客户提交和管理训练作业,而且您无需担心底层训练基础设施。您和您的客户还可以将训练算法、训练数据集和训练容器保留在 Amazon S3Amazon EFS 中的托管式数据湖中,这些数据湖提供了非常高的可靠性和可用性。这些数据湖将自动横向扩展以支持您的业务增长,同时最大限度地减少维护工作。此外,您还可以使用 Amazon SQS 整合数据流和工作流并通知客户管理任务和下载模型,以编排整体模型训练管道。

    阅读《卓越运营》白皮书 
  • 本指引利用数据分离策略限制用户对敏感数据的访问,并将所有核心服务都放置在私有子网中,因此限制了公共互联网的访问。例如,您的管理员只能通过一个 AWS 虚拟专用网络(AWS VPN)连接访问堡垒主机和关键训练数据。Amazon EFS 的安全组规则可以帮助您只允许平台管理员进行访问,因此最终客户无法直接访问关键的训练源数据。此外,通过为 Amazon S3 设置访问策略,您可以允许个别客户上传和下载他们自己的数据,但无法访问或影响其他客户的数据。

    阅读《安全性》白皮书 
  • 用户通过应用程序负载均衡器登录到您的 Web 门户,应用程序负载均衡器将流量分配到目标计算实例。当 Amazon Elastic Compute Cloud(Amazon EC2)Auto Scaling 检测到运行状况不佳的实例时,它会终止此实例并启动一个新实例,这样,此服务就可以不间断地继续运行。本指引还使用专为实现高可用性和高可靠性而设计的 Amazon S3。客户可以使用 Amazon S3 存储模型构件。

    阅读《可靠性》白皮书 
  • SageMaker 可以帮助您大规模训练和调整模型,而无需管理基础设施。当您的客户从门户提交训练作业时,SageMaker 可以定义适当的训练资源,以帮助大规模分配训练工作负载。这样可以减少客户完成关键训练作业时所需的时间和成本。

    阅读《性能效率》白皮书 
  • 只在客户提交训练作业时根据需要预置模型训练资源。您还可以应用 Amazon SageMaker Savings Plans,以降低机器学习训练成本。此外,通过定义 SageMaker ResourceConfig 以确定适当的机器学习实例和存储卷,您的客户可以在模型生命周期内动态管理他们的资源。此外,通过使用 AWS Auto Scaling,您的平台可以自动预置所需的额外实例,以处理意外的训练门户工作负载,并在需求下降时自动缩减规模,这样就无需托管空闲实例。AWS Auto Scaling 可以与 Amazon EC2 Auto Scaling 结合使用,以扩展更多的资源。

    阅读《成本优化》白皮书 
  • 通过采用无服务器基础设施和托管式服务,您可以避免过度预置训练资源和存储资源,从而减少碳足迹。例如,SageMakerAWS Auto Scaling 将只使用执行训练作业和训练门户时所需的计算资源,因此帮助您最大限度地减少了预置的计算资源。此外,您还可以将 Amazon S3Amazon EFS 用作您的训练数据来源的数据湖。这些服务提供了多种存储类,以帮助您避免过度预置存储容量。

    阅读《可持续性》白皮书 

实施资源

提供了在 AWS 账户中进行实验和使用的详细指南。构建指南的每个阶段(包括部署、使用和清理)都将被检查,以便为部署做好准备。

示例代码为起点。它经过行业验证,是规范性但不是决定性的,可以帮助您开始。

[主题]
[内容类型]

[标题]

[子标题]
此[博客文章/电子书/指南/示例代码]演示了如何 [插入简短描述]。

免责声明

示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。

本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。

此页内容对您是否有帮助?