Innovium 通过在 AWS 上运行芯片设计工作负载来加快创新

需要有助于实现可扩展性和弹性的技术

在以太网交换机制造领域,速度是关键。像 Innovium 这样的为以太网交换机设计和制造芯片的公司必须尽快将产品交到客户手中,以在紧迫的交付期限内完工。然而,作为一家初创公司,Innovium 无法提供满足其业务需求所需的计算和存储资源。“我们为世界上一些最大的公司提供服务,因此需要按时可靠地交付产品。”Innovium 技术副总裁 Keith Ring 说,“我们知道,使用本地基础设施模型不可能实现这一点。由于缺乏必要的物理空间、冷却能力和电力,我们无法获得所需的计算能力来经济高效地完成工作。”

Innovium 还需要更大的弹性,以便根据需求扩展或缩减其电子设计自动化 (EDA) 工作负载。“我们在设计产品的早期阶段使用了少量服务器,但在设计的最后几个月,我们需要大幅扩展计算和存储资源。”Innovium 创始人兼首席开发官 Mohammad Issa 说,

 

“使用 AWS,我们可以消除扩展计算资源的障碍,只专注于产品创新。”

– Innovium 技术副总裁 Keith Ring


  • 关于 Innovium
  • Innovium 的总部位于美国加州硅谷,致力于为全球数据中心提供高性能芯片交换机。该公司的 TERALYNX 产品系列包含从 3.2Tbps 到 12.8Tbps 不等的软件兼容产品。

     

  • AWS 的优势
    • 通过按需将 HPC 工作负载扩展到数百个核心来加快创新
    • 满足严格的产品交付 SLA
    • 与更大的公司竞争
  • 使用的 AWS 服务
Innovium 通过在 AWS 上运行芯片设计工作负载来加快创新

在高内存 Amazon EC2 实例上运行 HPC 工作负载

为了满足其对可扩展性和弹性的需求,Innovium 选择在 Amazon Web Services (AWS) 云上设置其高性能计算 (HPC) 环境。“我们选择 AWS 是因为它是云计算领域的领导者,提供经过验证的功能,而且我们的一些开发人员拥有与 AWS 合作的经验。”Issa 说。

Innovium 使用由 Intel Xeon E7 处理器提供技术支持的高内存 Amazon Elastic Compute Cloud (Amazon EC2) X1 实例,以支持内存密集型 HPC 工作负载。“运行 HPC 作业时,我们需要尽可能大的内存空间,以便以线性方式增加核心数量。”Ring 说,“Amazon EC2 X1 实例可以满足这一要求。”

按需扩展到数百个核心

自从迁移到 AWS 以来,Innovium 的 HPC 处理吞吐量提高了八倍。“许多 EDA 工具都是针对数百个核心而设计的,AWS 为我们提供的解决方案能让我们获得这种可扩展性。”Ring 说,“使用 AWS,我们利用了每个作业可扩展到 264 个核心的能力,并将核心分布在多台计算机上,与使用本地服务器相比,这种方式的性能更高。这意味着,我们可以快速轻松地扩展,以支持集成电路设计工作负载。”

满足严格的产品交付 SLA

随着可扩展性和弹性的提高,Innovium 可以放心且一致地按时向客户提供高质量的产品,并专注于芯片开发的创新,而不是基础设施管理。“AWS 云的弹性使我们能够在产品设计的最后阶段快速打开或关闭核心。”Issa 说,“借助 AWS 云服务的可用性,Innovium 可以构建一个本地数据中心,以满足平均使用需求,同时将高峰工作负载转移到云中。” AWS 云的可用性和可靠性还使 Innovium 能够降低进度风险。“借助 AWS,我们可以更可靠地在商定的时间范围内交付产品。”Ring 说,“我们不会因为计算能力不足而无法按时交付产品。”

此外,由于 Innovium 可以启动计算资源并在 EDA 作业完成后终止它们,因此该公司可以避免过度预置本地容量产生的成本。“鉴于能够在短时间内访问大量计算机,我们不必投入资金和资源来过度构建本地数据中心即可应对高峰负载。”Issa 说。

 

与更大的公司竞争

可靠且可扩展计算资源的可用性是为小型公司提供公平竞争环境的关键。“在这个行业,除了集成电路创新之外,产品的交付还面临着一些障碍,其中基础设施可扩展性尤为突出。对于小公司来说,这些障碍可能更大。”Ring 说,“使用 AWS,我们可以消除扩展计算资源的障碍,只专注于产品创新。”


了解更多

了解有关 AWS 上的高性能计算的更多信息。