GUC は AWS パートナーの proteanTecs と協力して ASIC の信頼性と品質を大幅に向上
2021 年
Global Unichip Corporation (GUC) は、システムおよび半導体企業が特定用途向け集積回路 (ASIC)、つまりマイクロチップを開発するのを支援しています。ASIC は世代ごとに設計が複雑になり、より高度な半導体プロセスが用いられるため、品質目標の達成が難しくなっています。しかし、これらの ASIC は、稼働時間とシステムの信頼性が重要なデータセンターシステムのコンポーネントになります。この課題に取り組むために、GUC は Amazon Web Services (AWS) のセレクトテクノロジーパートナーである proteanTecs と契約しました。同社は、ディープデータと機械学習を利用して電子機器の故障を予測します。そのソフトウェアソリューションでは、ASIC が現場で動作しているときでも、ダウンタイムやシステムの中断なしで ASIC のパフォーマンスを監視できます。
「非常に大量のデータについて GUC のフィードバックを迅速に提供するために、proteanTecs は AWS を利用して、毎日何百万ものシミュレーションを実行する高性能コンピューティングワークロードをサポートするために必要なスケーラビリティと柔軟性を実現しています」と、proteanTecs の共同創設者兼ソフトウェア担当副社長である Yuval Bonen 氏は言います。AWS を利用した proteanTecs 分析プラットフォームを通じて、GUC のお客様は ASIC を綿密に監視し、シリコン障害を積極的に検出して修復できます。
開発のごく初期の段階でも、proteanTecs は既に信頼性の監視と修復のメカニズムに欠かせない存在になっていました”
Igor Elkanovich 氏
Global Unichip Corporation の最高技術責任者
規模と複雑さの増大
GUC は、主要株主である Taiwan Semiconductor Manufacturing Company (TSMC) による ASIC 製造の設計、インターフェイス知的財産 (IP) 開発、および管理に重点を置いています。世界規模の大規模半導体メーカーは、2019 年に 499 の異なる顧客向けに 272 の異なる技術を用いて 10,761 種類の製品を製造しました。GUC の最高技術責任者である Igor Elkanovich 氏は、「私たちは、お客様がプロジェクトを持ち寄る前に、新しい半導体プロセス、新しい組立技術、新しいインターフェイスを採用しています」と述べています。「私たちは TSMC と非常に緊密に連携しているため、その技術はまだ開発中ですが、既に採用と IP 開発を並行して手がけています。TSMC の技術がお客様に提供される頃には、IP はシリコンによる実証済みで、GUC の開発フローの一部となっています」。
GUC が新世代の ASIC をリリースするたびに、設計とプロセスはより複雑になります。「トランジスタの数、チップの複雑さ、処理能力は何倍にも増しました。最近の高度なパッケージ技術の革命により、さまざまなダイを 1 つのヘテロジニアス集積回路パッケージにまとめて組み立てることができるようになりました」と Elkanovich 氏は説明します。大きな機能回路は、いくつかのシリコンダイを使用して製造されます。「お客様に高い帯域幅とパフォーマンスを提供するために、ダイ間は密に相互接続されています」と Elkanovich 氏は言います。「ASIC のほとんどは、指数関数的に増加するデータセンターアプリケーションなどのミッションクリティカルなアプリケーションに使用されるため、信頼性が求められます。そして、いったん伸びると、失敗するたびにその影響が悪化します。信頼性を高めながら、最も複雑な設計を開発したいと考えています。これが proteanTecs を使って取り組んでいる課題です」。
GUC は proteanTecs と契約し、ASIC に組み込まれたユニバーサルチップテレメトリー技術から得られたデータを、AWS 上の proteanTecs クラウドシステムを用いて予測型人工知能やデータ分析と組み合わせています。これにより、システム障害を引き起こす前にシリコンの欠陥を追跡して修復しました。このような対策を講じることで、GUC と proteanTecs は GUC の ASIC の品質と信頼性を高めることができます。
Amazon EC2 スポットインスタンスでハイパフォーマンスコンピューティングワークロードを実行
proteanTecs は、Intel Xeon プロセッサー搭載の Amazon Elastic Compute Cloud (Amazon EC2) のスポットインスタンスでハイパフォーマンスコンピューティングワークロードを実行しています。同社の Kubernetes コンテナオーケストレーションシステムは Amazon EC2 インスタンスでも動作します。また、proteanTecs がワークロードの急増を検出すると、Kubernetes クラスターがスポットインスタンスの数を増やすリクエストをトリガーして、proteanTecs がそのワークロードを簡単に処理できるようにします。スポットインスタンスを使用すると、会社のコンピューティングコストを約 60% 削減できます。
また、proteanTecs は Amazon Relational Database Service (Amazon RDS) を使用してアプリケーションメタデータを保存しています。Amazon RDS を使用すれば、クラウド内でリレーショナルデータベースを簡単にセットアップ、運用、スケールできます。ハードウェアのプロビジョニング、データベースのセットアップ、パッチ適用、バックアップなどの時間がかかる管理タスクを自動化しながら、コスト効率とサイズ変更可能な容量を提供します。これにより、同社の DevOps チームの時間を大幅に節約できます。
データプライバシーは GUC にとって重要であるため、proteanTecs は GUC に Amazon Virtual Private Cloud (Amazon VPC) を提供しています。これは AWS を利用して独自のシステムで動作しています。ProteanTecs ソリューションへの接続はすべて、リスクを軽減し、ProteanTecs と GUC がお互いのデータを見ることを防ぐ仮想プライベートネットワークつまり安全なクローズドチャネルを使用しています。
AWS パートナーの proteanTecs を利用して ASIC の品質と信頼性を促進する
GUC と proteanTecs は、2.5D ダイツーダイインターコネクト用の GUC の高帯域幅メモリインターフェイス IP で初めて協力しました。一般的な設計では、ASIC は複数の高帯域幅メモリコンポーネントを使用し、それらを数万本の回線で接続します。通常の ASIC 運用中、proteanTecs は ASIC に組み込まれたユニバーサルチップテレメトリーからデータを収集し、そのデータを分析して現場の回線のシグナルインテグリティを評価しています。proteanTecs は、将来の不具合につながる可能性のある回線の品質低下を検出すると、次のメンテナンスサイクルで事前にインストールされた冗長回線と交換します。これにより、ASIC のライフサイクルが延長され、システム障害が防止され、お客様のデータセンターアプリケーションの障害が発生したシステムを高いコストをかけて交換する必要がなくなります。このプロセス全体は、お客様の通常の運用でダウンタイムや中断なしに完了します。
GUC はこれまで、製造プロセス中に ASIC を監視していましたが、proteanTec を使用することで、現場での可視性と修理可能性を維持できます。「以前は、ASIC で何が起こっているのかほとんどわかりませんでした」と Elkanovich 氏は言います。「proteanTecs ソリューションを追加すると、まったく異なる見方ができるようになりました。今では、これまで発見できなかった物理的効果を観察して修復できるようになりました」。
将来の信頼性につながる追加ラインを構築
GUC と proteanTecs は次世代のインターフェイスで協力しています。次世代インターフェイスは、2.5D 世代のサイドバイサイドダイアセンブリとは対照的に、TSMC の 3DFabric ダイアセンブリを使用して開発される予定です。これらのインターフェイスのダイ間には数十万本のラインがあるため、各 ASIC のコンピューティング能力とメモリが大幅に増加します。「開発のごく初期の段階でも、proteanTecs は既に信頼性の監視と修復のメカニズムに欠かせない存在になっていました」と Elkanovich 氏は言います。「今では、アーキテクチャから物理的な実装まで、すべての開発段階で信頼性を高めることに取り組むことができます」。
お客様のデータセンターアプリケーションが拡大し、ASIC が複雑になっても、GUC は AWS パートナーの proteanTecs が提供するソリューションを使用して、予測型の ASIC モニタリングを引き続き提供します。「複雑さが増すにつれて、信頼性は必然的に損なわれると考える人もいます」と Elkanovich 氏は言います。「私たちの目的は逆です。私たちの目標は、お客様により高い信頼性とスケーラビリティを提供することです」。
Global Unichip Corporation について
台湾に本社を置く Global Unichip Corporation (GUC) は、システムおよび半導体企業が特定用途向け集積回路 (ASIC)、つまりマイクロチップを設計および開発するのを支援しています。その親会社である Taiwan Semiconductor Manufacturing Company は、世界的な半導体メーカーです。
AWS の利点
- ASIC の信頼性と品質を大規模に向上
- 通常のシステム運用中に、現場の ASIC を監視および修理
- コストのかかるシステム障害や運用中の交換を防止
使用されている AWS のサービス
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) は、安全でサイズ変更可能なコンピューティング性能をクラウド内で提供するウェブサービスです。デベロッパーがウェブスケールのクラウドコンピューティングを簡単に利用できるように設計されています。
Amazon EC2 スポットインスタンス
Amazon EC2 スポットインスタンスを使うと、AWS クラウド内の使用されていない EC2 キャパシティーを活用できます。スポットインスタンスは、オンデマンド料金に比べ最大 90% の割引価格でご利用いただけます。
Amazon RDS
Amazon Relational Database Service (Amazon RDS) を使用すると、クラウド上のリレーショナルデータベースのセットアップ、オペレーション、スケールが簡単になります。
Amazon VPC
Amazon Virtual Private Cloud (Amazon VPC) は、定義した論理的に分離された仮想ネットワークで AWS リソースを起動できるようにするサービスです。
開始方法
あらゆる業界のさまざまな規模のお客様が、AWS を活用してビジネスを日々変革しています。AWS のエキスパートにお問い合わせのうえ、今すぐ AWS クラウドジャーニーを開始しましょう。