Print

GUC engagiert den AWS-Partner proteanTecs, um die ASIC-Zuverlässigkeit und -Qualität im großen Maßstab zu erhöhen

2021

Die Global Unichip Corporation (GUC) unterstützt System- und Halbleiterunternehmen bei der Entwicklung anwendungsspezifischer integrierter Schaltungen (ASICs) oder Mikrochips. Jede Generation von ASICs hat ein komplexeres Design und verwendet fortschrittlichere Halbleiterprozesse, wodurch es schwieriger wird, die Qualitätsvorgaben zu erreichen. Diese ASICs werden jedoch zu Komponenten in Rechenzentrumssystemen, in denen Verfügbarkeit und Systemzuverlässigkeit von entscheidender Bedeutung sind. Um diese Herausforderung zu bewältigen, beauftragte GUC den Select Technology Partner proteanTecs von Amazon Web Services (AWS), der mithilfe von Deep Data und Machine Learning Fehler in der Elektronik vorhersagt. Dessen Softwarelösung kann die ASIC-Leistung ohne Ausfallzeiten oder Systemunterbrechungen überwachen, auch wenn ASICs vor Ort im Einsatz sind. 

„Um schnell GUC-Feedback zu einer sehr großen Datenmenge bereitzustellen, nutzt proteanTecs AWS, um die Skalierbarkeit und Flexibilität zu erreichen, die es für die Unterstützung von High-Performance-Computing-Workloads benötigt, auf denen täglich Millionen von Simulationen ausgeführt werden“, sagt Yuval Bonen, Cofounder und Vice President of Software bei proteanTecs. Durch die AWS-gestützte proteanTecs-Analyseplattform können GUC-Kunden ihre ASICs genau überwachen, um proaktiv Chipausfälle zu erkennen und zu reparieren.

kr_quotemark

Schon jetzt, in einem sehr frühen Stadium der Entwicklung, ist proteanTecs ein integraler Bestandteil unseres Mechanismus zur Zuverlässigkeitskontrolle und Reparatur.“

Igor Elkanovich
Chief Technology Officer, Global Unichip Corporation

In Größe und Komplexität wachsen

GUC konzentriert sich auf das Design, die Entwicklung von geistigem Eigentum (IP) für Schnittstellen und das Management der ASIC-Fertigung durch seinen Hauptaktionär, die Taiwan Semiconductor Manufacturing Company (TSMC). Die große globale Halbleiterfabrik stellte 2019 insgesamt 10 761 verschiedene Produkte mit 272 verschiedenen Technologien für 499 verschiedene Kunden her. „Wir setzen ein neues Halbleiterverfahren, eine neue Montagetechnologie und neue Schnittstellen ein, bevor der Kunde mit seinen Projekten zu uns kommt“, sagt Igor Elkanovich, Chief Technology Officer bei GUC. „Wir arbeiten sehr eng mit TSMC zusammen. Die Technologie befindet sich zwar noch in der Entwicklung, wir beginnen jedoch bereits damit, sie einzuführen und parallel geistiges Eigentum zu entwickeln. Bis die TSMC-Technologie für den Kunden verfügbar ist, ist das IP chipgeprüft und Teil des Entwicklungsablaufs von GUC.“ 

Jedes Mal, wenn GUC eine neue Generation von ASICs herausbringt, werden das Design und die Prozesse komplexer. „Wir haben die Anzahl der Transistoren, die Komplexität der Chips und die Verarbeitungsleistung um ein Vielfaches erhöht. Und mit der jüngsten Revolution in der fortschrittlichen Gehäusetechnologie können wir jetzt viele verschiedene Chips in einem heterogenen integrierten Schaltkreisgehäuse zusammenfügen“, erklärt Elkanovich. Große Funktionskreise werden unter Verwendung mehrerer Siliziumchips hergestellt. „Zwischen den Chips besteht eine dichte Verbindung, um unseren Kunden eine hohe Bandbreite und Leistung zu bieten“, sagt Elkanovich. „Sie erfordern Zuverlässigkeit, da die meisten ASICs für unternehmenskritische Anwendungen verwendet werden, wie z. B. Rechenzentrumsanwendungen, die exponentiell wachsen. Und sobald sie wachsen, verschlimmern sich die Auswirkungen jedes Fehlers. Wir wollen die komplexesten Designs entwickeln und gleichzeitig die Zuverlässigkeit erhöhen. Und dieser Herausforderung stellen wir uns mit proteanTecs.“ 

GUC beauftragte proteanTecs mit der Kombination von Daten aus der in den ASICs eingebetteten Universal-Chip-Telemetry-Technologie mit prädiktiver künstlicher Intelligenz und Datenanalyse (unter Verwendung des proteanTecs-Cloud-Systems auf AWS), um Chipdefekte zu verfolgen und zu reparieren, bevor sie zu Systemausfällen führen. Durch diese Maßnahmen können GUC und proteanTecs die Qualität und Zuverlässigkeit der ASICs von GUC erhöhen.

Ausführen von High-Performance-Computing-Workloads auf Amazon-EC2-Spot-Instances

proteanTecs führt seine High-Performance-Computing-Workloads mit Intel Xeon Prozessoren aus, angetrieben von Amazon Elastic Compute Cloud (Amazon EC2) Spot Instances. Das Kubernetes-Container-Orchestrierungssystem läuft ebenfalls auf Amazon-EC2-Instances. Und wann immer proteanTecs einen Anstieg der Workload feststellt, löst der Kubernetes-Cluster eine Anfrage zur Erhöhung der Anzahl der Spot Instances aus, damit proteanTecs diese Workload problemlos verarbeiten kann. Die Verwendung von Spot Instances reduziert die Rechenkosten des Unternehmens um etwa 60 Prozent. 

proteanTecs verwendet auch den Amazon Relational Database Service (Amazon RDS), um Anwendungsmetadaten zu speichern. Mit Amazon RDS ist das Einrichten, Betreiben und Skalieren einer relationalen Datenbank in der Cloud ganz simpel. Der Service stellt kosteneffiziente und anpassbare Kapazitäten zur Verfügung und automatisiert zeitaufwendige Verwaltungsaufgaben wie die Hardwarebereitstellung, die Datenbankeinrichtung, das Einlesen von Patches und die Datensicherung. Das spart dem DevOps-Team des Unternehmens viel Zeit. 

Da Datenschutz für GUC wichtig ist, stellt proteanTecs GUC eine Amazon Virtual Private Cloud (Amazon VPC) zur Verfügung, die mithilfe von AWS auf ihrem eigenen System ausgeführt wird. Jede Verbindung zur proteanTecs-Lösung verwendet ein virtuelles privates Netzwerk oder einen sicheren geschlossenen Kanal, der das Risiko reduziert und verhindert, dass proteanTecs und GUC die Daten des jeweils anderen sehen.

Qualität und Zuverlässigkeit von ASICs mit dem AWS-Partner proteanTecs vereinfachen

GUC und proteanTecs arbeiteten zunächst zusammen an der Speicherschnittstellen-IP von GUC mit hoher Bandbreite für 2,5D-Die-to-Die-Verbindungen. Im typischen Design verwendet der ASIC mehrere Speicherkomponenten mit hoher Bandbreite, die mit Zehntausenden von Leitungen miteinander verbunden werden. Während des normalen ASIC-Betriebs sammelt proteanTecs Daten von der im ASIC eingebetteten Universal-Chip-Telemetrie und analysiert diese Daten, um die Signalintegrität der Leitungen im Feld zu beurteilen. Wenn proteanTecs eine Qualitätsminderung für eine Leitung feststellt, die zu zukünftigen Defekten führen kann, ersetzt das System diese im nächsten Wartungszyklus durch eine vorinstallierte redundante Leitung. Dies verlängert den Lebenszyklus des ASIC, verhindert Systemausfälle und vermeidet den kostspieligen Austausch ausgefallener Systeme für die Rechenzentrumsanwendungen der Kunden. Dieser gesamte Prozess wird ohne Ausfallzeiten oder Störungen des normalen Betriebs des Kunden durchgeführt. 

GUC hat seine ASICs zuvor während des Herstellungsprozesses überwacht; aber durch den Einsatz von proteanTecs kann das Unternehmen diese Transparenz und Reparaturfähigkeit vor Ort aufrechterhalten. „Bisher hatten wir wenig Einblick in das, was in den ASICs passierte“, sagt Elkanovich. „Nachdem wir die proteanTecs-Lösung hinzufügten, hatten wir eine völlig andere Sichtweise. Jetzt beobachten und reparieren wir physische Effekte, die wir zuvor nicht entdecken konnten.“

Bau zusätzlicher Linien für zukünftige Zuverlässigkeit

GUC und proteanTecs arbeiten gemeinsam an der nächsten Generation von Schnittstellen, die mithilfe der 3DFabric-Dies-Assembly von TSMC entwickelt werden, im Gegensatz zur Side-by-Side-Dies-Assembly der 2.5D-Generation. Diese Schnittstellen werden über Hunderttausende von Leitungen zwischen den Chips verfügen, wodurch die Rechenleistung und der Speicher in jedem ASIC erheblich erhöht werden. „Schon jetzt, in einem sehr frühen Stadium der Entwicklung, ist proteanTecs ein integraler Bestandteil unseres Mechanismus zur Zuverlässigkeitskontrolle und Reparatur,“ sagt Elkanovich. „Jetzt können wir die Zuverlässigkeit in allen Entwicklungsphasen, von der Architektur bis zur physischen Implementierung, gemeinsam angehen.“ 

Auch wenn die Rechenzentrumsanwendungen der Kunden wachsen und ASICs immer komplexer werden, wird GUC weiterhin prädiktives ASIC-Monitoring anbieten und dabei die vom AWS-Partner proteanTecs angebotene Lösung nutzen. „Manche Leute denken, dass mit zunehmender Komplexität die Zuverlässigkeit unweigerlich beeinträchtigt wird“, sagt Elkanovich. „Unser Ziel ist das Gegenteil. Unser Ziel ist es, unseren Kunden mehr Skalierbarkeit bei noch besserer Zuverlässigkeit zu bieten.“


Über die Global Unichip Corporation

Die Global Unichip Corporation (GUC) mit Hauptsitz in Taiwan unterstützt System- und Halbleiterunternehmen bei der Konzeption und Entwicklung anwendungsspezifischer integrierter Schaltungen (ASICs), also Mikrochips. Ihre Muttergesellschaft, die Taiwan Semiconductor Manufacturing Company, ist ein globales Halbleiterfertigungsunternehmen.

Vorteile von AWS

  • Erreicht ASIC-Zuverlässigkeit und -Qualität im großen Maßstab
  • Überwacht und repariert ASICs vor Ort während des normalen Systembetriebs
  • Beugt kostspieligen Systemausfällen und deren Austausch während des Betriebs vor

Genutzte AWS-Services

Amazon EC2

Der Web-Service Amazon Elastic Compute Cloud (Amazon EC2) stellt sichere, skalierbare Rechenkapazitäten in der Cloud bereit. Der Service ist darauf ausgelegt, Web-Scale-Cloud-Computing für Entwickler zu erleichtern.

Weitere Informationen »

Amazon EC2-Spot-Instances

Mit Amazon EC2 Spot-Instances können Sie die Vorteile nicht genutzter EC2-Kapazitäten in der AWS Cloud nutzen. Spot-Instances sind mit einem Rabatt von bis zu 90 % im Vergleich zum On-Demand-Preis verfügbar. 

Mehr erfahren »

Amazon RDS

Amazon Relational Database Service (Amazon RDS) erleichtert Ihnen die Einrichtung, Verwaltung und Skalierung einer relationalen Datenbank in der Cloud.

Mehr erfahren »

Amazon VPC

Amazon Virtual Private Cloud (Amazon VPC) ist ein Service, mit dem Sie AWS-Ressourcen in einem logisch isolierten virtuellen Netzwerk starten können, das Sie definieren. 

Mehr erfahren »


Erste Schritte

Unternehmen jeder Größe und aus jeder Branche transformieren ihr Geschäft mit AWS. Kontaktieren Sie unsere Experten und beginnen Sie noch heute damit, AWS Cloud kennen zu lernen.