[SEO 副标题]
本指南演示了使用云环境的工程师、科学家和研究人员团队如何托管全面产品开发工作负载所需的许可工程工具。它展示了工程应用团队如何在短短数小时内部署可扩展的工程协作室,以满足与可信供应商联合开发的组织安全要求。借助本指南,工程师可以与熟悉的工具目录进行交互,这些工具已无缝集成到直观的门户网站中。
注意:[免责声明]
架构图

[架构图描述]
第 1 步
弹性负载均衡有助于确保跨可用区的可访问性。它可以部署在公有子网(默认)或私有子网中。
第 2 步
Amazon Elastic Compute Cloud(Amazon EC2)实例实施了一个高性能计算(HPC)工作负载管理器(OpenPBS),用于动态预置用户提交的作业所需的 AWS 资源。
Amazon EC2 Auto Scaling 自动预置运行集群用户任务(如扩展计算作业)所需的资源。
第 3 步
控制器实例托管 Web 界面,以允许用户和管理员与环境交互。
第 4 步
Amazon ElastiCache 通过设置内存缓存,帮助优化 Web 用户界面(UI)和编排工具的整体性能。
第 5 步
整个配置存储在 AWS Systems Manager 的功能 Parameter Store 中,可通过 API 轻松检索。
第 6 步
启动使用 Amazon DCV 提交批处理作业并运行图形用户界面(GUI)工具的 Linux 或 Windows 虚拟桌面。
第 7 步
通过本指南,您可以将 Amazon Elastic File System(Amazon EFS)、Amazon Simple Storage Service(Amazon S3)或 Amazon FSx 部署为存储提供者。
第 8 步
AWS Budgets 和 AWS Cost Explorer 成本管理服务可让您深入了解集群产生的 AWS 支出,并设置成本护栏以防止超出分配的预算。
第 9 步
HPC 和虚拟桌面信息会在可选的 Amazon OpenSearch Service 上自动建立索引。
第 10 步
使用安全服务和资源,例如 AWS Secrets Manager、AWS Certificate Manager(ACM)和 AWS Identity and Access Management(IAM)。
第 11 步
使用 Amazon Cognito 或 AWS Directory Service 作为身份提供者。此外,如果需要,您还可以部署独立的 OpenLDAP 服务器。除了元数据外,OpenSearch Service 集群还存储作业和主机信息。
第 12 步
与 AWS Backup 的本机集成会自动拍摄您的环境资源快照,例如关键 EC2 实例和文件系统。
Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
-
卓越运营
OpenSearch Service 可自动摄取和保留重要的集群和作业元数据,从而实现长期数据分析和业务建议。Amazon CloudWatch 可近乎实时地监控 HPC 和可视化节点指标,从而能够检测异常和优化系统性能。可视化作业信息(包括运行时间、许可证利用率、定价和资源分配)可优化计算基础设施。
-
安全性
限定权限范围的 IAM 策略有助于确保安全环境所需的最低权限。多个 Amazon EC2 安全组可限制网络流量并增强保护。HTTPS 证书和目录服务凭证等敏感信息分别安全地存储在 ACM 和 Secrets Manager 中。如果启用单点登录(SSO),SAML 身份验证将交给 Amazon Cognito,从而提供安全且可扩展的身份验证解决方案。
-
可靠性
ELB 在多个可用区之间分配流量,提高了 HPC 和虚拟桌面基础架构(VDI)工作负载的可靠性。部署具有多个子网的虚拟私有云(VPC)可提供高可用性和对 Amazon EC2 容量的访问,从而降低可能影响紧密耦合作业的容量限制风险。
-
性能效率
包括计算、存储和联网在内的最佳 AWS 基础设施可满足计算机辅助工程(CAE)模拟的独特性能要求。Elastic Fabric Adapter(EFA)可优化大规模 HPC 工作负载的节点间延迟通信。高性能或并行文件系统(例如适用于 Lustre 的 Amazon FSx)可处理 I/O 密集型工作负载。 利用 Amazon DCV 的高性能远程显示协议,可帮助您优化图形密集型工作负载(例如 CAD)的现有体验。
-
成本优化
AWS Budgets 提供护栏,可防止计算和存储资源的过度配置超出分配的预算阈值。该服务与 HPC 作业提交队列紧密集成,因此每个队列或项目的分配预算不能超过客户定义的阈值。AWS 成本分配标签让管理员能够了解当前在项目、团队、用户或服务级别上的支出,有助于确保对 AWS 资源进行准确核算。
-
可持续性
Amazon EFS 可自动将不经常访问的数据转移到较低的存储层,从而减少系统占用空间和降低相关成本。EC2 自动扩缩组取代了持久性 EC2 实例,从而最大限度地减少了计算浪费。此外,Amazon EC2 计算选项的广泛性使您可以优化每个应用程序,从而进一步减少您的碳足迹。
相关内容

Amazon Lab126 创建了 HPC 解决方案,旨在帮助团队提升开发和创新的速度
Kuiper 项目使用 NICE DCV 安全、远程地访问用于卫星开发的 EDA 软件
免责声明
示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。
本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指南是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。