Amazon Web Services ブログ
FSx for NetApp ONTAP と IBM LSF による EDA のスケール
本記事は、Craig Chamberlin、Donna Yasay、Kartik Gopal、Matt Morrisによる記事 EDA Scale with FSx for NetApp ONTAP and IBM LSF を翻訳したものです。
はじめに
シリコン設計チームは、コストを低く抑えながら、より効率的な製品をより迅速に提供する必要性に絶えず迫られています。コンピューティング、ストレージ、およびその他の IT リソースをシリコン設計チームに提供する EDA (Electronic Design Automation) インフラストラクチャチームは、 RTL から GDSII までのサイクルを短縮する上で重要な役割を果たすことができます。
歴史的に、 EDA ワークロードのコンピューティングキャパシティは、オンプレミスのデータセンターに配置されてきました。しかし、高度なノード設計では、より複雑なチェックと、チェック毎に多くの操作が必要になり、これらによりオンプレミス EDA セットアップの制限が明らかになっていきます。多くの場合、このワークロードはコストを最適化するように設計されているため、バースト EDA ワークロードの容量が制限されるか、ピーク使用率に合わせて設計されており、十分にキャパシティリソースを活用できていません。一方で、オンプレミスの EDA コンピューティング容量を無限にスケーリングすると、コストと時間の面で非現実的となります。
AWS は、従量課金制モデルで非常にスケーラブルなコンピューティングキャパシティを提供し、 EDA ワークロードのターンアラウンドタイムを短縮し、 EDA ライセンスの価値を最大化し、テープアウトまでの時間を短縮します。需要に基づいてコンピューティングを柔軟にスケールアップまたはスケールダウンする AWS の機能により、大規模なコンピューティング需要予測の必要がなくなり、 EDA に自然に適合します。従量課金制モデルと AWS でのコンピューティングの秒単位の課金により、コスト効率を達成できます。 AWS で運用の複雑さが軽減されたことで、 EDA インフラストラクチャ チームはイノベーションにより集中できるようになりました。
AWS によるオンデマンドのスケーラビリティ
オンデマンドキャパシティをクラウドにバーストするオンプレミスとのハイブリッド EDA ソリューションは、 エンドユーザーのエクスペリエンス、既存のツールまたはフローを変更することなく、オンデマンドにジョブ転送ロジックをシームレスに使用できるようにする必要があります。また、コンピューティングホストとデータの効率的で動的な管理により、優れたパフォーマンスと最適化されたコストを実現します。
IBM LSF は EDA で最も一般的なジョブスケジューラであり、 NetApp ONTAP は EDA ストレージの一般的な選択肢です。オンプレミスで IBM LSF と NetApp を使用する EDA 環境については、 LSF のマルチクラスター機能を使用して現在の環境を AWS にシームレスにスケールし、効率的なデータ管理のために NetApp ONTAP 用のジョブ転送と Amazon FSx を実装するリファレンス アーキテクチャを公開しています。この資料は、 PoC の実装を促進し、 EDA ワークロードを AWS にシームレスにスケーリングすることを目的としています。
オンプレミスにおける、 LSF スケジューラと NetApp ストレージを持った EDA 環境と典型的な設計エンジニアのワークフローは次のとおりです。
EDA のバーストキャパシティを AWS にスケールするとき、既存のツール、フロー、およびプロセスとの互換性が最も重要です。以下のリファレンス アーキテクチャは、 Amazon FSx for NetApp ONTAP と IBM Spectrum LSF をマルチクラスタモードで使用した EDA スケールを示しています。
LSF はマルチクラスタモードで構成されます。 AWS 上の LSF 管理ホストは、IBM Spectrum LSF Resource Connector を使用して、 Amazon Elastic Compute Cloud (EC2) インスタンスを動的にプロビジョニングし、 EDA ジョブを実行します。インフラストラクチャとコストの効率は、必要なときに必要な時間だけコンピューティング サーバーをプロビジョニングすることで実現します。 NetApp FlexCache は、アクティブなデータをオンデマンドで遅延読み込みするために使用され、データへの低遅延な読み取りアクセスを提供します。 AWS への EDA のスケールは、最小限の変更で実現されます。
FSx for NetApp ONTAP および IBM LSF Multicluster を使用して AWS にスケールするには、次の 4 つの簡単な手順を実行します。
- AWS での EDA クラスターのセットアップ
- オンプレミス データセンターを AWS に接続
- NetApp ボリュームのピアリングと FlexCache のセットアップ
- IBM LSF マルチクラスターの有効化
アーキテクチャの詳細
AWS 上の EDA クラスターは、オンプレミスと変わらず、更に俊敏性、柔軟性、および動的スケーリングの利点が追加されています。クラスターのセットアップは、 オンプレミスのデータセンターに最も近い AWS リージョンに Amazon Virtual Private Cloud (VPC) をデプロイすることから始まり、レイテンシーの削減と最高のパフォーマンスを実現します。 AWS VPC は、既存の EDA コンピューティングキャパシティを拡張したものです。したがって、 AWS VPC における CIDR ブロックの範囲がオンプレミス IP と重複しないようにするには、入念な IP アドレス配置の計画が必要です。サブネットをデプロイするために VPC 内の Availability Zone が選択されます。 AWS での EDA スケールの場合、 AWS のコンピューティングエンティティは、 LSF 管理ホストと、動的にプロビジョニングされた LSF 実行ホストであり、どちらも Amazon EC2 を使用してモデル化されています。どちらもインターネットからアクセスする必要はなく、必要に応じてオンプレミスゲートウェイ経由でインターネットにアクセスできます。したがって、上記のホストはプライベートサブネットに存在します。最小権限の原則は、 AWS Security Groups 、 Network Access Control Lists (NACL) 、およびルートテーブルを使用して実装されます。
AWS の管理ホストで LSF Resource Connector が有効になり、 EC2 実行ホストを動的にプロビジョニングして、スケール キャパシティの需要を満たすことができます。 EC2 インスタンスはアイドル時に終了し、コストを最適化した EDA セットアップを実現します。 Amazon FSx for NetApp ONTAP は、 AWS 上の EDA 向けに、フルマネージドで、信頼性が高く、スケーラブルで、パフォーマンスが高く、機能豊富な NetApp ストレージを提供します。 FSx for NetApp ONTAP で作成されたボリュームには、 EDA ワークロード用のツールバイナリ、構成ファイル、および設計データが格納されます。
オンプレミスネットワークと AWS VPC 間の接続は、 AWS Site-To-Site VPN と AWS Direct Connect を使用して実現されます。 AWS Site-To-Site VPN は、エンドポイント間に安全で冗長な IPSec トンネルを提供しますが、インターネットを通過するパケットの予測できないレイテンシーが伴います。 AWS Direct Connect は、 802.1q VLAN を使用してオンプレミスと AWS 間に閉域なレイヤー 2 接続を提供し、より高いスループットと予測可能なレイテンシーを実現します。両方のサービスを一緒に使用して、オンプレミスのデータセンターと AWS の間に安全で可用性の高い接続を提供できます。 AWS Transit Gateway は AWS 側で VPN コンセントレーターとして機能し、オンプレミスで構成されたカスタマー ゲートウェイに接続します。 AWS Transit Gateway は、仮想アプライアンスの設置を必要とせずに、フルマネージドサービスとして VPC とオンプレミス ネットワークを接続するためのハブアンドスポーク設計を提供します。
Amazon FSx for NetApp ONTAP を使用すると、 AWS でフルマネージド型の ONTAP ファイル システムを起動して実行できます。オンプレミスの NetApp ファイルシステムの使い慣れた機能、パフォーマンス、および API を、 AWS サービスの俊敏性、スケーラビリティ、操作のシンプルさとともに提供します。オンプレミスと AWS の NetApp ボリュームが相互に通信できるようにするには、 NetApp クラスターと Storage Virtual Machines (SVM) ピアリングをセットアップする必要があります。 NetApp の FlexCache は、必要なアクティブデータのみを遅延読み込みし、 EDA データへの低遅延アクセスを提供します。双方向の FlexCache 構成により、出力データをオンプレミスの NetApp ストレージにコピーして、オンプレミスのユーザーワークステーションから表示およびデバッグすることができます。
IBM Spectrum LSF は、マルチクラスターモードでデプロイされます。マルチクラスターモードでは、 LSF 管理ホストはオンプレミスと AWS で実行されます。 AWS でのコンピューティングリソースの動的スケーリングは、 AWS にデプロイされた管理ホストで LSF Resource Connector を動作させることで実現されます。 IBM Spectrum LSF を使用した EDA ワークショップは 、 Resource Connector を使用して AWS に IBM LSF をデプロイするための自動化コードを提供します。オンプレミスと AWS にデプロイされる LSF クラスターは、 lsf.shared ファイルのエントリを編集することで相互に認識され、オンプレミスと AWS LSF クラスターでのジョブの転送/受信機能は、それぞれ lsb.queues ファイルで設定されます。 詳細は LSF のドキュメントをご参照ください。
まとめ
プロセスノードが 7 nm から 5 nm 、 3 nm に進むにつれて、 AWS の事実上無限の計算能力により、シリコンの開発時間を大幅に短縮できます。 IBM Spectrum LSF Multicluster は、オンプレミスの EDA クラスターを AWS にシームレスに拡張するのに役立ちます。一方、 Amazon FSx for NetApp ONTAP は、 AWS のフルマネージドな NetApp ストレージを EDA 用に AWS で提供します。 FSx for NetApp ONTAP と IBM LSF による EDA のスケールは、既存のツールとフローへの変更を最小限に抑えながら、既存の EDA インフラストラクチャを AWS に拡張するためのリファレンスアーキテクチャを提供し、 RTL-2-GDSII サイクルを短縮することを可能にします。
詳しくは 「 AWS の半導体とエレクトロニクス」と、 「 AWS EDA Workshop 」をご参照ください。
翻訳はソリューションアーキテクトの 村松 謙 が担当しました。原文はこちらです。