亚马逊AWS官方博客

AWS 上的半导体设计工作流程(入门博客)

欢迎阅读我们的第一篇半导体和电子的博客!这篇文章以及未来陆续发布的其他文章将帮助AWS客户和合作伙伴及时了解AWS半导体和电子团队的活动,并为在AWS上运行半导体和电子工作流程提供规范指导。我们的团队成员分布在全球各地,致力于帮助全球客户加速其关键的半导体工作流程,包括从前端设计和验证,到后端制造、封装和组装的全部流程。我们的团队由行业领导者组成,每个行业领导者在半导体和电子行业都有数十年的经验。我们利用这种经验来指导客户,从他们最初的AWS入门到运行他们的第一个生产工作负载。

我们的半导体和电子博客文章都包含哪些内容?

  • 通过动手实验和AWS参考架构来实现的工作负载赋能
  • 我们将参加的行业活动,包括SEMICON,设计自动化会议 (DAC),Synopsys SNUG和Cadence Live(CDNLive)
  • 能够帮助您在AWS上快速部署环境的研讨会信息
  • 有助于半导体工作负载扩展的新服务和功能介绍

在第一篇文章中,我们会概述在AWS上运行半导体设计工作流程的过程。我们会通过AWS参考架构来说明数据迁移的路径,并介绍一些AWS服务。本文的假设前提是您在运行生产工作负载之前,先进行概念验证(PoC)。下面是我们将使用的参考架构图。

我们非常理解当您还不熟悉AWS时将本地数据中心中正在运行的内容转换为AWS服务可能会有些困难。在上图中,我们提供了本地和AWS混合架构,以说明您当前的环境如何映射到AWS。我们将向您介绍该架构,重点介绍用到的服务以及AWS Cloud的能力如何为半导体和电子设计和制造工作流程提供功能强大的可扩展平台。对于半导体用例,这些工作流程可能包括:

  • 电子设计自动化(EDA),包含仿真 (simulation),验证 (verification) 和signoff
  • 计算光刻技术,包含光学邻近校正(OPC)

计算机辅助工程,包含电磁 (electromagnetics),热力 (thermal),材料 (materials) 和多物理场 (multiphysics)

  • 机器学习训练和分析,例如良率分析和失效分析 (Yield and Failure analysis)
  • 供应链和第三方协作,例如问题调试 (debugging problems) 或与第三方IP提供商的协作 (collaborating)
  • 软件/固件回归测试 (regression testing)

 

参考架构介绍

对于上图中每个有数字编号部分,我们都将提供指导,并重点介绍半导体和电子行业的客户正在使用的AWS服务。

1:确定用于概念验证或测试的工具和数据

在AWS上运行概念验证之前,您必须确定要运行哪个工具以及成功运行PoC所需的数据。如果您选择的工具或工作负载具有过多的依赖关系,或者所需要的数据很难从整个工作流程进行拆分,那么第一步可能会成为艰巨的任务。为了减少依赖性,我们建议您选择有云上许可的工具,和可以独立(或几乎独立)使用的数据集。我们经常与客户合作来解除遗留了数十年的依赖性问题,并且我们通常会发现从新项目开始或从非常小的设计开始对PoC最为有效。

另外,AWS半导体解决方案架构师团队可以举办为期一天的研讨会,内容是如何在AWS上启动完整半导体设计环境。这不需要使用专有的客户数据或第三方数据,而是提供了如何在AWS上运行工作负载的示例。我们稍后将就此提供更多详细信息。

 

2:使用AWS Snowball,AWS Direct Connect或其他AWS服务将数据传输到AWS

一旦确定了PoC所需的数据,就需要将这些数据传输到AWS上。传输方式取决于传输的数据量。如果您只有相对少量的的静态数据,并且有快速,可靠的互联网连接,则可以通过互联网将数据传输到AWS。另外,考虑到未来的工作,可能超出了本次PoC的范围,如果您打算频繁地将数据传入和传出AWS,那么您应该考虑使用AWS Direct Connect。使用AWS Direct Connect,您可以在AWS与数据中心,办公室或托管环境之间建立专用连接,与使用互联网相比,在多数情况下它可以降低网络成本,提高带宽吞吐量并提供更一致的网络体验。如果您有大量的库文件,设计数据或模拟数据需要进行一次性传输,则应考虑使用AWS Snowball。 AWS Snowball Edge支持高达100TB的容量,并具有丰富的功能组合,可提供边缘服务和集群功能。有关更多信息,请参阅AWS Snowball常见问题解答中的何时使用Snowball部分。

 

3:传输到AWS的数据最初应放在S3存储桶中

将数据传输至AWS时,数据存储的初始最佳位置是Amazon S3存储桶。半导体工作负载需要兼容POSIX的文件系统,目前EDA工具不原生支持对象存储。将数据存储在S3中可提供多种功能,包括“ 十一个9”的可靠性,到EC2实例高达25Gpbs(每个实例)的传输速度,跨区域复制和数据分层(有关更多信息,请参阅Amazon S3功能Amazon S3常见问题解答)。我们将在“存储(#7)”部分中对此进行更多讨论,有些AWS服务提供了直连到S3存储桶的POSIX兼容文件系统。或者您可以在AWS上部署任何文件系统,然后将数据从S3快速传输到挂载了文件系统的EC2实例上。

将数据包含在S3中还可以实现敏捷性和快速试错。EC2与S3之间的高带宽连接使得数据可以在两者之间进行快速传输。因此,与其尝试在发生故障时维护数据或整个NFS文件系统,不如在几分钟内重建整个环境并将数据复制到新环境中。

 

4:用户通过远程桌面或者通过SSH用命令行访问

既然您的工具和数据都在AWS上,那么运行作业将与您在自己的数据中心中运行作业的方式非常类似。用户通过远程桌面或命令行登录(SSH)访问其环境,就像访问本地数据中心中的资源一样。工程和物理设计团队可以使用AWS NICE DCV,这是一个可以在多种网络条件下使用的安全的远程桌面解决方案。 NICE DCV没有额外的许可费用,您只需为用到的基础设施资源付费。

 

5:AWS上提供了半导体设计工作流程所需的所有基础架构

在AWS上运行半导体设计工具所需资源规格与您在数据中心时是一致的。AWS提供了许多服务可为整个工作流程提供支持基础架构。例如,许可管理 (license management) 对于半导体设计流程极为重要。您可以在几分钟内在AWS上部署许可管理服务 (License Manager),许可证可以从本地迁移或从您的供应商处额外购买。对于作业调度和编排,您可以部署当前架构正在使用的解决方案,或使用云原生方法,或者您可以利用AWS的灵活性,构建自定义编排流程。用户管理可以通过多种方式来完成,例如,利用我们的云原生服务,或继续使用您的本地用户管理解决方案。

 

6:AWS提供了全面的计算资源选择

在选择EC2实例之前,您应确定PoC所需的物理核总数和内存占用量。 AWS有200多种EC2实例类型(Amazon EC2实例类型),客户已经在许多EC2实例上成功运行了半导体和电子设计工作流程。我们看到许多客户使用我们的z1d,R5,C5,M5和X1实例类型。 z1d实例提供4 GHz稳定全内核频率处理器,内存/核心比率为16GB /物理核心。 z1d使得客户可以更快地运行作业,从而提高许可利用率,以此实现成本优化。 R5实例系列提供的总内存容量高达768 GB,并且内存与核心的比率为16GB /物理核心。对于需要更多内存的工作负载,例如物理设计和时序收敛,我们有X1实例系列和X1e实例系列。 X1e实例具有近4 TB的内存。此外,对于不需要每个内核使用那么多内存的计算密集型工作负载(例如前端设计),我们的客户使用C5实例M5实例系列。

选择实例类型之后,我们建议限制PoC的规模仅先测试功能。我们有许多灵活的定价选项,例如Amazon EC2竞价型实例,我们建议您先成功运行PoC后,确定适合您预算的定价选项,而不是进行大规模测试。

 

7:AWS上的存储选项使工作流程无需修改即可运行

如前所述,为了在符合 POSIX标准的文件系统上运行作业,AWS提供了几种选项。仅举几例,您可以从Amazon EFSAmazon FSx for lustre中进行选择,还可以在EC2实例上构建自己的文件系统。根据您现有工作流程的I / O状况,您应该构建一个与当前使用的文件系统相似的解决方案。例如,您应该确定您的工具是否需要具有高IOPS性能的文件系统,或用于大量顺序读取的高持续带宽,还是仅用于临时数据。关于每种文件系统解决方案的详细信息超出了本博客的范畴,我们将在以后的博客中对此进行介绍,您还可以与AWS 解决方案架构师一起确定满足您需求的最佳解决方案。

 

8:利用其他AWS服务

一旦将数据存储在AWS上,更具体地说是在Amazon S3中,您就可以利用AWS云提供的许多其他服务。许多半导体设计客户正在S3上构建数据湖,并将数据分析用于日志处理,许可证利用和作业调度优化。您还可以利用S3 智能分层来进行数据分层。智能分层旨在自动将数据移动到最经济的访问层来优化成本并且不影响性能或增加运营开销。如果您的团队位于其他较远的地理位置,请使用Amazon S3的另一个功能——跨区域复制(CRR)。这使您可以自动和异步地将数据复制到另一个AWS区域中的另一个存储桶。一旦您的数据存储在Amazon S3中,您就可以开始利用许多AWS服务来探索和扩展当前环境的功能。

 

9:隔离环境可提高安全性

在半导体和电子行业中,大多数设计都需要用到第三方供应商或IP供应商。在传统的本地环境中为了实现协作,可能需要对他们开放整个公司网络的访问权限。尽管可以采取安全措施,但是第三方仍在同一网络上。在AWS上,您可以定义一个单独的环境,只有与该项目有关的各方可以访问。也就是说,您不再需要打开网络,然后添加访问限制。相反,您可以逐一为每个项目设置一个全新的隔离环境。此外,与制造工厂的任何通信都可以通过安全,优化的网络链路完成。这不仅可以用于传输GDSII文件,还可以用于将良率分析数据传回半导体设计公司以提高生产率。

 

10:利用AWS基础架构和服务提高安全性

使用AWS,您可以有信心和掌控力在当前最灵活最安全的云计算环境开展业务。作为AWS客户,您将受益于AWS数据中心和旨在保护您的信息,身份,应用程序和设备的网络。借助AWS,您可以通过我们全面的服务和功能,进一步提高满足核心安全性和合规性要求的能力,例如数据本地性,保护性和机密性。

在AWS上您允许自动化执行安全检查任务,因此您可以将重点转移到扩展和创新业务上。而且您只需为使用的服务付费。所有客户都将从AWS受益,因为AWS是唯一经过其服务产品和相关供应链审查,并被认为足够安全可以运行顶级机密工作负载的商业云。

请参阅以下链接以获取有关安全性的更多信息:AWS 云安全性AWS 密钥管理服务(KMS)

 

总结

AWS拥有来自世界各地的客户,以最先进的制程工艺来设计产品,从小型ASIC到具有数百亿个晶体管的大型SOC。我们仅在此博客文章中重点展示了一些功能; AWS半导体和电子行业团队将发布有关这些主题的更详细的帖子,并根据持续的客户反馈添加不同的主题。请稍后查阅。

我们期待着帮助您更快地创新!

 

 

阅读英文原文,请点击 https://amazonaws-china.com/blogs/industries/semiconductor-design-workflows-on-aws-introductory-blog/

 

校译作者

黄振维

半導體行業解決方案架構師, 目前專注於以AWS well-architected 策略協助客戶在雲上建構安全且高可靠系統滿足需求

丁杰

AWS 解决方案架构师,8年以上大型移动互联网研发及技术管理经验,资深云计算行业从业者。对EDA行业上云以及针对云上架构进行优化设计有深入理解。了解云计算及半导体行业技术发展变革方向,能针对云服务特点在行业解决方案上有前瞻性布局