- AWS 解决方案库›
- AWS 上发电互连仿真指南
AWS 上发电互连仿真指南
概览
工作原理
这些技术细节包含一张架构图,用于说明如何有效使用本解决方案。该架构图展示了关键组件及其相互作用,并逐步概述了架构的结构和功能。
Well-Architected 支柱
上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。
Amplify 可让您快速安全地为 HPC 集群设置和管理无服务器用户界面,而 Step Functions 可帮助您可视化和控制协调任务步骤的工作流程。CloudWatch 根据收集的指标监控集群的性能,帮助您深入了解运营情况。而且,借助 CloudFormation,您可以使用基础设施即代码来配置环境,限制人为错误并提高事件响应的一致性。所有这些服务都由 AWS 完全托管。
Cognito 为前端提供顺畅的客户身份和访问管理,支持实现用户池以及联合登录和访问。联合访问可使用现有的身份和权限,并提供与公司其他部门相同安全级别的统一用户体验。通过根据最小权限原则确定 AWS 身份和访问管理 (IAM) 策略的范围,您可以限制对资源的未经授权的访问。
EC2 Auto Scaling 将 Amazon EC2 实例平均分配到多个可用区(AZ),以提高容错性和可用性。EC2 Auto Scaling 可以检测到实例运行不佳的状况,并终止实例,然后启动新实例以替换它。此外,如果一个可用区不可用,EC2 Auto Scaling 可以在另一个可用区启动实例以进行补偿。Amazon FSx 支持 HPC 应用程序实现高每秒进行读写操作的次数(IOPS)和大吞吐量,它还可部署到多个可用区,通过在多用区之间同步复制数据来提高耐用性。它还能在计划内的系统维护和计划外的服务中断期间,通过自动故障转移到备用可用区来提高可用性。这有助于保护数据免受实例故障和可用区中断的影响。最后,Amazon S3 为输入和输出数据提供持久可靠的存储。
ParallelCluster 使用 EC2 Auto Scaling 组动态增减必要的实例以满足需求,从而确保资源大小适合工作负载。Amazon FSx 可处理海量数据集,吞吐量达每秒数百 GB,IOPS 达数百万,延迟时间达亚毫秒级。
Step Functions 和 Lambda 通过事件驱动模式帮助最大限度地降低成本:未提交任务时不会产生任何成本。此外,ParallelCluster 使用 EC2 Auto Scaling 组,仅筛选出所需的实例运行,从而避免了资源空闲和浪费。ParallelCluster 使用 EC2 Auto Scaling 启动模板为已提交的任务启动实例,并且您可以根据性能基准和资源利用率选择最具成本效益的实例类型。 CloudWatch 监控使用情况并提供日志和见解,帮助您合理调整实例集实例的规模,控制工作负载运行开支。
Amazon S3 Intelligent-Tiering 监控访问模式并自动在各层之间移动对象,从而在成本和节能以及访问效率之间取得平衡。EC2 Auto Scaling 可帮助您动态扩展 HPC 集群的计算实例集,避免资源闲置,从而提供更高效、更可持续的解决方案。此外,Step Functions 和 Lambda 仅在处理任务提交时运行,不会在 HPC 集群空闲时间内运行,从而减少所需的资源,降低工作负载对环境的影响。
免责声明
找到今天要查找的内容了吗?
请提供您的意见,以便我们改进网页内容的质量。