利用 AWS 上的 HPC 的强大功能

解决大规模计算问题,获得新见解

创建免费账户
联系销售人员

高性能计算 (HPC) 使科学家和工程师们能够解决复杂的计算密集型问题。HPC 应用程序通常需要高网络性能、快速存储、大量内存、超高计算能力或上述所有条件。通过 AWS,您可以在云中运行 HPC,并将并行任务的数量增加到大多数本地 环境都无法支持的规模,从而提高研究速度并缩短获得成效的时间。AWS 可按需提供针对特定应用程序进行优化的 CPU、GPU 和 FPGA 服务器,无需巨额资金投入,从而帮助降低成本。


hpc-01

立即在 AWS 上启动或纵向扩展高性能计算群集。通过消除作业排队时间并根据需要高度扩展群集 (如有必要),您可以在减少上市时间或发布时间。

hpc-02

专注于基础设施维护和升级方面的应用程序和研究输出。当 AWS 升级硬件时,您可以立即获得访问权限,只需重新编写群集配置文件并重新启动即可迁移到最新的硬件。

hpc-03

让您的研究决定基础设施,而不是基础设施决定研究。借助 AWS 提供的灵活配置选项,您可以从假设开始,创建针对您的独特应用程序需求 (今天需要 GPU,明天需要 CPU) 进行了优化的 HPC 群集。

hpc-04

除了用于计算、存储和数据库的核心服务选项之外,您还可以利用 AWS 生态系统中的广泛服务和多个合作伙伴来增强您的 工作负载。选项范围从熟悉的解决方案 (如 NICEThinkbox) 到 AWS Lambda 的实验版本,应有尽有。

hpc-05

在不影响安全性的前提下开展协作。每个 AWS 产品都可提供加密和各种选项,以向每个用户授予精细权限,同时能够在多个获批用户之间共享数据。构建符合 HIPAA、FISMA、FedRAMP、PCI 等标准的解决方案。

hpc-06

让花在您任务上的每一美元都有意义。您可以从一系列 AWS 产品中进行选择,且只需按实际用量付费。您无需再为空闲的计算功能付费,不必签订长期合同,也无需提供复杂的许可证。使用 Amazon EC2 竞价实例进一步优化成本。

  • 生命科学

    基因组学

    加州大学伯克利分校的人机算法联合 (AMP) 实验室利用 AWS 快速扩展分析基因组学工作中使用的算法所需的计算资源。了解更多 >>

    计算化学

    Novartis 使用 AWS 构建了一个可运行约 87000 个计算核心的平台,可在 9 小时内完成 39 年的计算化学作业,且成本仅为 4232 美元。了解更多 >>

    生物系统模拟

    宾州州立大学将其研究门户迁移到了 AWS,使全球 6000 名研究人员能够轻松设计超过 50000 个合成 DNA 序列。了解更多 >>

    蛋白质建模

    旧金山州立大学计算机科学系使用 Amazon EC2 来降低运行机器学习工作负载的成本并缩短其周转时间。了解更多 >>

    logo_amplab
    logo_novartis
    logo_penn-state
    logo_sfsu
  • 金融服务

    资本管理与报告

    MAPFRE 节省了 88% 的基础设施成本,同时获得了按需启动超级计算机并在用完后将其关闭的能力。了解更多 >>

    风险管理组合优化

    通过在 AWS 上运行金融模型来评估市场风险,Yuanta Securities Korea 受益良多,不仅提高了速度,还降低了成本。了解更多 >>

    合同定价与估值  

    Aon Benfield 将其基础设施迁移到了 AWS,并构建了一个处理系统,将策略重新计算时间从几小时或几天缩短到了几分钟。了解更多 >>

    logo_mapfre
    logo_yuanta
    logo_aon
  • 制造业

    计算流体动力学 (CFD)

    使用 EC2 竞价实例,TLG Aerospace 能够以更低的成本获得更多内存和核心,从而可以扩展越发严格的模拟数量和大小。了解更多 >>

    工程模拟

    使用网络兼容的增强型 EC2 实例,Ansys 进行了一场模拟,可轻松扩展至 1000 个内核以上,展示了近乎理想的可扩展性,并且即使超过 2000 个内核,整体解决方案时间也可大大缩短。了解更多 >>

    logo_tlg-aerospace
    logo_ansys
  • 能源与地球科学

    天气模拟

    The Weather Company 重新设计了其大数据平台、预测系统和应用程序,以在云环境中本机运行,并将其内部环境从 13 个数据中心减少到 6 个,使工程师能够腾出手来构建网络和提高应用程序效率。了解更多 >>

    油藏模拟

    Rock Flow Dynamics 使用按需计算资源来运行工作负载,从而能够更好地对油井和注水井进行定位。使用 AWS 资源,本来需要几年才能完成的任务在 12 天内就可以完成了。了解更多 >>

    地理信息系统 (GIS)

    使用 AWS,Digital Globe 在几周而非几个月内就向其客户了提供 PB 级的高分辨率地球图像、数据和分析,同时还节省了成本。了解更多 >>

    运营、管理和分析

    通过使用 AWS 和 Amazon EC2 竞价实例,Fugro Roames 使 Ergon Energy 的年度植被管理成本从 100000000 AUD 降到了 60000000 AUD。了解更多 >>

    logo_weathercompany
    logo_rfd
    logo_digital-globe
    logo_roames
  • 半导体

    电子设计自动化

    Cadence Design Systems 使用 AWS 来隔离工作负载,确保用户和应用程序不会为资源竞争,从而缩短了回归时间,加快了迭代速度,并将重点转移到了优化和敏捷性上。了解更多 >>

    电子模拟

    Cypress Semiconductor 在 AWS 上执行并行计算,并使用 COMSOL Multiphysics 来模拟电容式传感器组件中的电磁场分布,从而将模拟时间从几周缩短到了几小时。了解更多 >>

    logo_cadence
    logo_cypress
持续交付

AWS 上的高性能计算工作负载在由 Amazon Elastic Compute Cloud (Amazon EC2) 启用的虚拟服务器 (称为实例) 上运行。Amazon EC2 可在云中提供可调整大小的安全计算容量,并可提供范围广泛的实例类型,因此,您可以选择针对您的工作负载进行了优化的类型。

实例类型
建议的 HPC 用法
技术亮点

C5

计算优化型

计算密集型工作负载,如工程和金融模拟、材料科学和基因组学处理、地震处理、数字和类比模拟、流体动力学、计算光刻和计量学、天气模拟等等
  • 基于 Intel Xeon Platinum 处理器 (Skylake)
  • 可提供最多 36 个内核 (72 个 vCPU) 和最多 144GiB 的内存
  • 支持 Intel Advanced Vector Extension 512 (AVX-512) 矢量处理指令集
  • 具有 EC2 实例类型中的最高时钟速度

M4

通用

需要平衡内存与内核的应用程序和工作负载,以及通用计算,如 HPC 管理节点、许可证服务器、远程登录节点等
  • 基于 Intel Haswell 和 Broadwell 处理器
  • 可提供最多 32 个内核 (64 个 vCPU) 和最多 256GiB 的内存

R4

内存优化型

需要的内存与内核比高于 C5 或 M4 实例的应用程序,包括内存密集型工程和科学模拟、半导体掩模验证等
  • 基于 Intel Broadwell 处理器
  • 可提供最多 32 个内核 (64 个 vCPU) 和最多 488GiB 的内存

P3

 加速计算

工程模拟、计算金融学、地震分析、分子建模、基因组学、渲染以及其他 GPU 计算工作负载
  • 最多可提供 8 个 NVIDIA Tesla V100 GPU
  • 高达 1 PFLOPS 的混合精度、125 TFLOPS 的单精度和 62 TFLOPS 的双精度浮点性能
  • 通过 NVIDIA NVLink GPU 到 GPU 的互连,实现高达 300GB/s 的吞吐量
  • 最多配备 64 个 vCPU、488GB 的 DRAM 和每秒 25GB 的专用聚合网络带宽

F1

加速计算

并行的硬件加速应用程序,包括视频分析、图像处理、金融计算、基因组学以及加速数据分析和搜索
  • 可在单个 EC2 实例中提供最多 8 个 Xilinx Virtex UltraScale+ VU9P FPGA 设备

G3

加速计算

高性能图形应用程序,包括图形远程桌面、3D 建模和模拟、医疗和地理空间成像以及视频内容分发
  • 可在单个 EC2 实例中提供最多 4 个 NVIDIA Kepler 或 Maxwell GPU
  • 针对图形处理和远程可视化进行了优化
  • Amazon AppStream 2.0 提供,是一种完全托管的应用程序流服务,能够对 HPC 工作负载进行预处理和后处理。将 HPC 可视化应用程序提供给具有 HTML5 浏览器的任意桌面上的大型用户群。
  • Amazon WorkSpaces Graphics 服务包使用,它可在云中启用 GPU 加速的虚拟 Windows 桌面。WorkSpaces Graphics 服务包专为工程师和 3D 应用程序开发人员设计,可用于取代昂贵的图形工作站。

X1

内存优化型

每个内核需要最大内存量的应用程序,包括内存中分析图和稀疏矩阵处理、半导体时序分析等
  • 基于 Intel Haswell 处理器
  • 可提供最多 64 个内核 (128 个 vCPU) 和最多 1952GiB 的内存

持续交付

高性能计算工作负载管理可在云中获得新级别的灵活性,这使得资源和作业编排成为了工作负载的重要考虑因素。AWS 为工作负载编排提供了一系列解决方案:完全托管的服务使您能够将更多精力集中在与预置、配置和优化群集及作业计划程序相关的作业请求和输出上;自我管理型解决方案让您可以自行配置和维护云原生群集,并将传统作业计划程序用于 AWS 上或混合 场景中。

AWS 产品
描述
亮点
AWS Batch AWS Batch 是一项完全托管的服务,让您可以轻松地在云上运行大型计算工作负载,而无需担心资源预置或管理计划程序。您可通过 Web 控制台、AWS CLI 或软件开发工具与 AWS Batch 进行交互。
  • 完全托管的服务
  • 专注于您的任务及其资源,而非基础设施
  • 通过轻松使用 EC2 竞价实例和预留实例降低成本
  • 轻松为数以万计的核心的工作进行优先级排序
AWS Lambda 无需预置或管理服务器即可运行代码,您只需为实际使用的计算时间付费。  它可定义使用多种语言编写的短期函数,并允许 Lambda 大规模管理执行。
  • 完全托管的服务
  • 针对短期操作进行了优化
  • Lambda 属于“无服务器”服务,您仅需按运行函数时的实际用量付费
AWS Step Functions 一种完全托管的服务,让您能够使用可视工作流轻松协调分布式应用程序和微服务的组件。
  • 完全托管的服务
  • 与 AWS Batch、AWS Lambda 和其他服务轻松集成

CfnCluster
一种开源框架,可在配备了预安装的开源批处理计划程序和 MPI 库的 AWS 上部署高性能群集。
  • 开源软件
  • 使用第三方计划程序快速部署群集
  • 使用 AWS CloudFormation 作为基础模板
EnginFrame HPC 门户可与各种开源系统和商用批处理调度系统集成。它是适用于作业提交、控制和数据管理的一站式服务。
  • 在本地、云中或混合云中运行
  • 可用于多个计划程序的“单一管理平台”
  • 应用程序模板

持续交付

AWS 提供了多种存储选项,从附加到 EC2 实例的文件系统到高性能对象存储,应有尽有。大多数 HPC 应用程序需要通过文件系统接口对多个 EC2 实例中的数据进行共享访问。AWS 提供了一种横向扩展的本机共享文件存储服务 (Amazon EFS),该服务可提供文件系统接口和文件系统语义。HPC 应用程序还可将 AWS 数据块存储产品 (Amazon EBS 或 EC2 实例存储) 用于通用工作存储。Amazon S3 和 Glacier 提供了低成本存储选项,可用于大型数据集的长期存储。

AWS 产品
描述与建议的 HPC 用法
亮点

Amazon EFS

 

高度可用且持久的、完全托管的多可用区文件系统

建议的 HPC 用法:用作工作存储的共享文件系统

  • 扩展到数万个核心
  • NFS 可挂载

Amazon EBS

 

用于 Amazon EC2 实例的持续性块存储卷

建议的 HPC 用法:用于高 IOPS 和通用工作存储

 

  • 与 Lustre 兼容
  • NFS 可挂载
  • 通过 Lustre 和 GPFS 等工具支持高速并行计算系统
  • 提供一系列速度和成本优化选项

Amazon EC2 实例存储

 

特定 Amazon EC2 实例类型随附的免费数据块存储

建议的 HPC 用法:用于读取频繁型临时工作存储

  • 随特定 EC2 实例类型提供
  • 快速 I/O
  • 短暂存储

Amazon S3

 

专为从任意位置存储和检索任意数量的数据而构建的对象存储

建议的 HPC 用法:用于 HPC 数据的可扩展的耐久主存储

  • 高度可用
  • 高度耐久
  • API 可通过 PUT 和 GET 请求进行访问

Amazon Glacier

 

一种安全、持久且成本极低的云存储服务,可用于数据存档和长期备份

建议的 HPC 用法:用于 HPC 数据的长期、低成本存档

  • 自动存档数据的生命周期工具
  • 非常经济实惠
  • 基于小时数的检索次数

持续交付

AWS 网络专为扩展而设计。无论您的应用程序是需要将数千个核心用于一个紧密耦合的工作负载,或是需要将数十万个核心用于高度并行、高吞吐量计算 (HTC) 应用程序,还是同时需要两者,AWS 网络均可提供相应的性能 (高带宽、低延迟) 和可扩展性。

AWS 专门针对 AWS 基础设施优化和自定义构建了自己的硬件。通过将直通式路由与 AWS 的大规模扩展功能结合使用,即使是最大的客户也能在使用最具挑战性的应用通信模式时实现一致的延迟和高带宽。与传统的虚拟化网络接口相比,增强联网能够提供更高的 I/O 性能和更低的 CPU 使用率。该功能可提高每秒数据包数 (PPS) 性能、缩短实例间的延迟,并大大降低网络抖动。增强联网功能可通过两种方式提供,具体取决于实例类型:Intel 82599 或 Amazon ENA。

联网功能
描述与 EC2 实例类型兼容性
优势
群集置放群组

集群置放群组是所选 AWS 地区内的逻辑分组或实例集群。

EC2 实例类型兼容性:支持增强联网功能的所有实例类型均可在集群置放群组内启动。了解更多 >>

  • 支持可靠的低延迟,实例间带宽最高可达 20Gbps
  • 可根据需要弹性扩展

第一代增强联网:

Intel 82599

  

 

Intel 82599 虚拟功能接口可为支持的实例类型提供高达 10Gbps 的网络速度,与传统虚拟化网络接口相比,它可提供更高的 I/O 性能和更低的 CPU 使用率。

EC2 实例类型兼容性:C3、C4、C5、D2、I2、R3 和 M4 (4.16xlarge 除外) 实例类型均可与 82599 兼容。了解更多 >>

  • 与传统实施相比,I/O 性能更高、CPU 利用率更低
  • 更高的每秒数据包数 (PPS) 性能
  • 更低的实例间延迟
  • 极低的网络抖动

第二代增强联网:

Elastic Network Adapter (ENA)

Elastic Network Adapter (ENA) 是优化的自定义网络接口,可提供高吞吐量和每秒数据包数 (PPS) 性能。

EC2 实例类型兼容性:目前 C5、P2、P3、R4、X1 和 m4.16xlarge 实例类型支持 ENA。了解更多 >>

  • 第一代的所有优势
  • 适应未来需求的驱动程序:设计用于支持高达 400Gbps 的联网,而无需更改驱动程序
  • 可在特定 EC2 实例类型上使用高达 25Gbps 的网络带宽

持续交付

从准备模拟输入数据到解释计算作业输出,高性能图形任务都是众多 HPC 工作负载的一部分。AWS 提供了多种产品来改善运行 OpenGL、Direct/X 和其他图形应用程序的性能,降低其成本并提高灵活性。您可以通过使用 GPU 驱动的 G2 和 G3 实例或 Elastic GPU 来加速图形性能,并使用 AppStream 2.0、WorkSpaces 或 NICE DCV 来流式处理 Windows 图形。如果您喜欢基于 Linux 的图形平台,那么通过将 NICE DCV 的流式处理性能和 EnginFrame 门户结合使用,您可以跨本地、混合云或完整 AWS 配置向最终用户提供端到端 HPC 工作流。

产品
描述
亮点
NICE DCV 针对高端图形进行了优化的安全流媒体协议,具有动态带宽管理功能
  • 可移动像素,并可保持 HPC 数据集中
  • 支持对 Linux 和 Windows 3D 应用程序进行远程访问
  • 在广泛网络区域内提供流畅的响应体验
  • 在本地和 AWS 上提供一致体验
NICE EnginFrame 带有内置交互式会话管理和批处理交互式工作流支持的 HPC 门户
  • 满足所有 HPC 用户需求的一站式服务
  • 简化协作
  • 在本地和 AWS 上提供一致体验
Amazon EC2 Elastic GPU 和 G2 实例
允许您轻松地向当前一代 EC2 实例添加低成本的图形加速
  • 在您只需少量 GPU 实现图形加速,或者您的应用程序可从一些 GPU 中受益但同时需要大量计算、内存或存储时,它是您的理想选择
  • 能够运行多种图形工作负载,如 3D 建模和渲染,并且可实现能与直连 GPU 相仿的工作站性能。
Amazon AppStream 2.0
一种完全托管且安全的应用程序流式传输服务,允许您将桌面应用程序从 AWS 流式传输到运行 Web 浏览器的任意设备
  • 可视化应用程序在 HPC 数据旁运行,可确保高质量、低延迟的可视化体验
  • 用户可随时随地安全访问其应用程序,因此,只要有 Web 连接,他们就可以提高工作效率
  • 使用针对图形进行了优化的 NICE DCV 协议进行应用程序交付
Amazon Workspaces 一种完全托管并且安全的桌面即服务 (DaaS) 解决方案,在 AWS 上运行。WorkSpaces 包括 GPU 加速的服务包,可支持工程、设计和架构应用程序,同时在云中提供安全性、经济性、灵活性和敏捷性等多项优势。
  • 可更快可视化模拟结果,因为您的应用程序可驻留在云中的数据旁
  • 支持 3D 应用程序开发、3D 建模、CAD、CAM 和 CAE 工具
  • 将桌面流式传输到众多支持的设备,包括 Windows 和 Mac PC、PCoIP 零客户端、Chromebooks、iPad、Fire 平板电脑、Android 平板电脑,甚至特定的智能手机
持续交付

AWS 针对 70 多种云服务提供即用即付的定价模式。使用 AWS 时,您只需为您需要的个别服务付费,具体根据您的使用时间计费,且无需签订长期合同或复杂的许可协议。AWS 定价方式与您支付水电费的方式类似。您只需为实际使用的服务付费,且停止使用后无需支付额外费用或终止费。详细了解 AWS 上的定价方式>>

为 Amazon EC2 上的计算容量付费共有三种方式:按需实例、预留实例和竞价实例。

计算定价模型
描述
建议的 HPC 用法:
按需实例 使用按需实例,您只需要按小时支付计算容量费用,无需签订长期合同或交纳预付款。您可以根据应用程序的需求提升或降低计算容量,并且只需按规定的小时费率为所使用的实例付费。
  • 希望拥有低成本和 Amazon EC2 提供的灵活性,且不想支付预付款或签订长期合同的用户
  • 首次在 Amazon EC2 上开发或测试的应用程序 (POC)
  • 具有短期、难应付或无法预测且不能中断的工作负载的应用程序
  • 紧急的高优先级工作负载
竞价实例 竞价型实例是一个定价模型,可使您以您选择的任何价格对未使用的 Amazon EC2 容量出价。当您的出价超过竞价价格时,可获得使用可用竞价实例的权限,只要出价超过竞价价格,就可以运行该实例。根据历史记录,竞价价格比按需价格低 50% 到 93%。了解有关借助竞价实例优化科学计算成本的更多信息 >>
  • 可容忍中断的工作负载
  • 开始时间和结束时间灵活的应用程序
  • 只能承受极低的计算价格的应用程序
预留实例 与按需实例的定价相比,预留实例可为您提供大幅折扣 (最高可达 75%)。此外,预留实例在分配给特定可用区后,可以提供容量预留,让您更相信自己能够按需启动实例。
  • 愿意使用 EC2 1 年或 3 年以上来降低总计算成本的客户
  • 使用率稳定的应用程序

AWS 合作伙伴提供专业的服务或软件解决方案,以支持 AWS 上的工作负载。浏览我们精选出的合作伙伴,并了解更多信息。

 

注册账户,并立即启动示例 HPC 工作负载。

Homepage_v6-01

您的账户将包含在 AWS 免费套餐内,以便您可以免费获得 AWS 平台、产品和服务的动手体验。

Homepage_v6-03

在您准备就绪后快速且轻松地构建您的 HPC 生产解决方案。

免费试用