本指引将介绍如何在 AWS 上部署天气研究和预报(WRF)模型,以预测美国大陆(CONUS)的天气。由美国国家大气研究中心(NCAR)提供的 WRF 模型有助于支持大气研究和运营预测应用程序。通过在 AWS 上使用高性能计算(HPC)集群运行 WRF 模型,您可以最大限度地提高天气预测工作负载的性能,从而准确、可靠地预测、计划和管理天气预报。

请注意:[免责声明]

架构图

下载架构图 PDF 
  • HPC 集群部署
  • 此架构图显示了如何预置 AWS ParallelCluster 用户界面(UI)以及如何配置具有计算和存储功能的 HPC 集群。对于数值天气预测工作流,请打开另一个选项卡。

  • 预测工作流
  • 此架构图显示了如何在 AWS 上部署 WRF 模型和设置数值天气预测工作流,以预测 CONUS 的天气。对于 HPC 集群部署,请打开另一个选项卡。

Well-Architected 支柱

当您在云中构建系统时,AWS Well-Architected Framework 可以帮助您了解所做决策的利弊。框架的六大支柱使您能够学习设计和操作可靠、安全、高效、经济高效且可持续的系统的架构最佳实践。使用 AWS 管理控制台中免费提供的 AWS Well-Architected Tool,您可以通过回答每个支柱的一组问题,根据这些最佳实践来检查您的工作负载。

上面的架构图是按照 Well-Architected 最佳实践创建的解决方案示例。要做到完全的良好架构,您应该遵循尽可能多的 Well-Architected 最佳实践。

  • 本指引将完全托管式服务(包括 API GatewayAmazon CognitoLambda)和自我管理的服务(包括适用于 Lustre 的 FSxAmazon EC2)结合使用。自我管理的服务通过一个模板部署到可配置的 HPC 集群,如果集群性能要求发生变化,可以重新配置或更新这些服务。您可以使用 Amazon CloudWatch 通过事件记录来监控所有这些服务。

    阅读《卓越运营》白皮书 
  • Amazon CognitoAPI Gateway 提供安全的身份验证和授权以及安全的 API 访问管理。随后,您可以使用 AWS Systems Manager 会话管理器 Secure Shell(可提供更高的安全性)或 NICE DCV 登录到 HPC 集群的头节点,以执行应用程序部署和管理。此外,适用于 Lustre 的 FSx 还提供了传输中数据加密和静态数据加密功能。通过将 AWS Identity and Access Management(IAM)策略的范围限定在所需的最低权限以内,您可以禁止对资源进行未经授权的访问。

    阅读《安全性》白皮书 
  • AWS ParallelCluster 使用 HPC 集群作业调度功能支持并行实施计算任务,并使用 Slurm 工作负载管理器,此管理器根据作业要求、优先级和用户定义的策略,以最佳方式分配资源。这样可以降低应用程序出现故障的可能性,因此您可以执行天气模拟并避免停机时间错误。此外,本指引还在不同的可用区中部署 EC2 实例以提高可靠性,而适用于 Lustre 的 FSx 为您的 HPC 集群提供了极其可靠的存储。

    阅读《可靠性》白皮书 
  • 本指引允许您使用 AWS ParallelCluster 和基于 YAML 的配置,高效地管理和预置 HPC 集群。AWS ParallelCluster 可以高效地横向和纵向扩展它的 CPU 和 RAM 足迹以及实例数量,以处理更多的工作负载。本指引还使用消息传递接口提供高效的并行处理和分布式数据处理功能。此外,适用于 Lustre 的 FSx 为 HPC 集群提供了高性能的存储层。

    阅读《性能效率》白皮书 
  • 作为一项托管式服务,Amazon Cognito 提供了经济高效的用户身份验证和授权。此外,Amazon EC2 Auto Scaling 根据工作负载需求横向或纵向扩展集群节点实例,因此您无需进行预置,也不必为未使用的资源付费。适用于 Lustre 的 FSx 还提供了经济高效的存储层,可以轻松为您的 HPC 任务启动、运行和扩展存储。

    阅读《成本优化》白皮书 
  • 本指引使用专用的 Amazon EC2 实例(包括由第三代 AMD Epyc 处理器提供支持的 Hpc6a 实例),它们为计算密集型 HPC 工作负载提供了高性能。将如此高的性能与 AWS 无服务器服务的弹性和可扩展性相结合,可以帮助您实现最佳资源利用率并避免过度预置资源。此外,适用于 Lustre 的 FSx 支持并行访问数千个计算实例中的相同文件和目录,可以进一步帮助您最大限度地减少工作负载对环境的影响。

    阅读《可持续性》白皮书 

实施资源

提供了在 AWS 账户中进行实验和使用的详细指南。构建指南的每个阶段(包括部署、使用和清理)都将被检查,以便为部署做好准备。

示例代码为起点。它经过行业验证,是规范性但不是决定性的,可以帮助您开始。

[主题]
[内容类型]

[标题]

[子标题]
此[博客文章/电子书/指南/示例代码]演示了如何 [插入简短描述]。

免责声明

示例代码;软件库;命令行工具;概念验证;模板;或其他相关技术(包括由我方人员提供的任何前述项)作为 AWS 内容按照《AWS 客户协议》或您与 AWS 之间的相关书面协议(以适用者为准)向您提供。您不应将这些 AWS 内容用在您的生产账户中,或用于生产或其他关键数据。您负责根据特定质量控制规程和标准测试、保护和优化 AWS 内容,例如示例代码,以使其适合生产级应用。部署 AWS 内容可能会因创建或使用 AWS 可收费资源(例如,运行 Amazon EC2 实例或使用 Amazon S3 存储)而产生 AWS 费用。

本指南中提及第三方服务或组织并不意味着 Amazon 或 AWS 与第三方之间存在认可、赞助或从属关系。AWS 的指导是一个技术起点,您可以在部署架构时自定义与第三方服务的集成。

此页内容对您是否有帮助?