Print

創意電子與 AWS 合作夥伴 proteanTecs 合作以大規模提高 ASIC 的可靠性和品質

2021

創意電子 (GUC) 協助系統和半導體公司開發特殊應用積體電路 (ASIC) 或微晶片。每一代新 ASIC 的設計都更複雜,並使用更先進的半導體製程,因此更難達到品質目標。這些 ASIC 成為資料中心系統中的元件,而對於資料中心而言,正常執行時間和系統可靠性至關重要。為應對這一挑戰,創意電子與 Amazon Web Services (AWS) 精選技術合作夥伴 proteanTecs 合作,後者善於利用深度資料和機器學習來預測電子設備中的故障。其軟體解決方案可以監控運作中的 ASIC 的效能,而不造成停機或系統中斷。 

「為了快速向創意電子提供關於大量資料的意見回饋,proteanTecs 使用 AWS 獲得所需的可擴展性和靈活性,以支援每天能夠執行數百萬次模擬的高效能運算工作負載,」proteanTecs 聯合創辦人兼軟體副總裁 Yuval Bonen 說道。透過 AWS 支援的 proteanTecs 分析平台,創意電子客戶可以密切監控他們的 ASIC,從而主動偵測和修復半導體故障。

kr_quotemark

即使在開發的早期階段,proteanTecs 就已經是我們可靠性監控和修復機制不可或缺的一部分。」

Igor Elkanovich
創意電子技術長

規模和複雜性不斷增長

創意電子專注於其主要股東台積電 (TSMC) 製造的 ASIC 的設計、介面智慧財產權 (IP) 開發和管理。作為一家大型全球半導體代工廠,台積電在 2019 年使用 272 種不同的技術,為 499 家不同的客戶製造了 10,761 種不同的產品。創意電子技術長 Igor Elkanovich 表示:「在客戶帶著他們的專案來找我們之前,我們採用了新的半導體製程、新的組裝技術和新的介面。」「我們與台積電密切合作,因此能夠率先採用一些仍在開發中的新技術,同時開發相關的 IP。直到客戶可以使用台積電的這些新技術時,相關的 IP 已通過半導體驗證並成為創意電子開發流程的一部分。」 

創意電子每次發佈的新一代 ASIC 在設計和製程上都會比上一代更加複雜。「我們已將晶體管數量、晶片複雜性和處理能力提高了許多倍,並且隨著最近先進封裝技術的革命,我們現在可以將許多不同的裸晶組裝在一個異構積體電路封裝中,」Elkanovich 解釋說。大型功能電路是使用多個裸晶製造的。「為了向客戶提供高頻寬和效能,裸晶之間存在密集互連,」Elkanovich 說道。「這時可靠性很重要,因為大多數 ASIC 都用於任務關鍵型應用程式,例如呈指數增長的資料中心應用。隨著規模的增長,故障的影響愈加嚴重。我們希望在開發複雜設計的同時提高可靠性。這是我們透過 proteanTecs 克服的挑戰。」 

創意電子與 proteanTecs 合作,使用 AWS 上的 proteanTecs 雲端系統將 ASIC 中嵌入的通用晶片遙測技術產生的資料與預測性人工智慧和資料分析相結合,以在半導體缺陷導致系統故障之前對缺陷進行追蹤和修復。透過採取這些措施,創意電子在 proteanTecs 的協助下提高了 ASIC 的品質和可靠性。

在 Amazon EC2 Spot 執行個體上執行高效能運算工作負載

proteanTecs 在採用英特爾 Xeon 處理器的Amazon Elastic Compute Cloud (Amazon EC2) Spot 執行個體上執行其高效能運算工作負載。其 Kubernetes 容器協同運作系統也在 Amazon EC2 執行個體上執行。每當 proteanTecs 發現工作負載激增時,其 Kubernetes 叢集就會觸發增加 Spot 執行個體數量的請求,從而讓 proteanTecs 能夠輕鬆應對工作負載的激增。使用 Spot 執行個體讓該公司的運算成本降低了大約 60%。 

proteanTecs 還使用 Amazon Relational Database Service (Amazon RDS) 來儲存應用程式中繼資料。Amazon RDS 可讓使用者在雲端輕鬆設定、操作和擴展關聯式資料庫。它提供符合成本效益且可調整大小的容量,且可自動處理硬體佈建、資料庫設定、修補程式和備份等耗時的管理任務。這讓該公司的 DevOps 團隊節省了大量時間。 

由於資料保密對創意電子很重要,proteanTecs 為創意電子提供了一個 Amazon Virtual Private Cloud (Amazon VPC),讓其使用 AWS 在自己的系統上執行此服務。與 proteanTecs 解決方案的任何連線都使用虛擬私有網路或安全封閉通道,這可以降低風險並防止 proteanTecs 和創意電子看到彼此的資料。

與 AWS 合作夥伴 proteanTecs 合作提高 ASIC 的品質和可靠性

創意電子和 proteanTecs 首先合作開發了創意電子用於 2.5D 晶片到晶片互連的高頻寬記憶體介面 IP。在典型的設計中,ASIC 使用由數萬條線路相連接的數個高頻寬記憶體元件。在 ASIC 正常運作期間,proteanTecs 從嵌入在 ASIC 中的通用晶片遙測收集資料,然後分析資料以評估線路的信號完整性。當 proteanTecs 偵測到可能在未來導致缺陷的線路品質下降時,系統會在下一個維護週期內用預裝的冗餘線路替換它。這延長了 ASIC 的生命週期,防止系統故障,並避免了為客戶的資料中心應用更換故障系統所需付出的高昂代價。整個過程是在不造成客戶停機或中斷運作的情況下完成的。 

創意電子之前在製造過程中監控 ASIC,然而透過與 proteanTecs 合作,其可以監控和修復運作中的 ASIC。「我們以前對 ASIC 的運作狀況知之甚少,」Elkanovich 說道。「在採用 proteanTecs 的解決方案之後,情況就完全不同了。現在我們能夠觀察實體影響並採取修復措施,這在以前是無法想象的。」

建置額外的線路應對未來的可靠性要求

創意電子和 proteanTecs 正在合作開發下一代介面,而其將由台積電的 3DFabric 裸晶組裝技術開發,而不是 2.5D 代的裸晶並排組裝技術。這些介面在晶片之間將有數十萬條線路,大大增加每個 ASIC 的運算能力和記憶體。「即使在開發的早期階段,proteanTecs 就已經是我們可靠性監控和修復機制不可或缺的一部分,」Elkanovich 說道。「現在我們可以在從架構到實體實作的各個開發階段解決可靠性問題。」 

即使客戶的資料中心應用不斷擴大且 ASIC 變得更加複雜,創意電子仍能夠使用 AWS 合作夥伴 proteanTecs 提供的解決方案繼續提供預測性 ASIC 監控。「有些人認為,隨著複雜性的增加,可靠性將不可避免地受到影響,」Elkanovich 說道。「針對這一點,我們的情況正好相反。我們的目標是以更高的可靠性水平為客戶提供更大的可擴展性。」


關於創意電子

創意電子 (GUC) 總部位於台灣,協助系統和半導體公司設計和開發特殊應用積體電路 (ASIC) 或微晶片。其母公司為全球半導體代工企業台積電。

AWS 帶來的效益

  • 大規模實現 ASIC 可靠性和品質
  • 在系統正常運作期間監控和修復使用中的 ASIC
  • 防止在運作期間發生代價高昂的系統故障和更換

使用的 AWS 服務

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) 是一種 Web 服務,可在雲端提供安全、可調整大小的運算容量。該服務旨在降低開發人員進行 Web 規模雲端運算的難度。

進一步了解 »

Amazon EC2 Spot 執行個體

透過 Amazon EC2 Spot 執行個體,您可以利用 AWS 雲端中未使用的 EC2 容量。與隨需價格相比,Spot 執行個體最高可享受 90% 的折扣。 

進一步了解 »

Amazon RDS

Amazon Relational Database Service (Amazon RDS) 讓使用者能夠在雲端中輕鬆設定、操作和擴展關聯式資料庫。

進一步了解 »

Amazon VPC

Amazon Virtual Private Cloud (Amazon VPC) 服務可讓您在您定義的邏輯隔離虛擬網路中啟動 AWS 資源。 

進一步了解 »


入門

各行各業、各種規模的公司每天都在使用 AWS 來轉型業務。聯絡我們的專家,立即開始 AWS 雲端之旅。