Astera Labs nutzt AWS zur Beschleunigung der Chipentwicklung

QuadX

Einhaltung von Tape-Out-Fristen

In der Halbleiterentwicklung gipfelt der Prozess des Entwurfs integrierter Chips in der Tape-Out-Phase, in der die Chipentwürfe für die Wafer-Fertigung freigegeben werden. Für Halbleiterunternehmen wie Astera Labs ist bis zur Tape-Out-Phase eine enorme Rechenkapazität erforderlich, um komplexe Simulationen schnell durchführen und Millionen von Transistoren, die den Chip physisch repräsentieren, platzieren und verlegen zu können. Astera wurde 2017 im kalifornischen Silicon Valley gegründet und ist ein Fabless-Halbleiterunternehmen, das individuelle Konnektivitätslösungen für datenzentrische Systeme entwickelt. „Wir müssen in der Lage sein, unsere Workloads während der Entwicklung zu skalieren und viele Simulationen parallel laufen zu lassen, damit wir überprüfen können, ob unser Chip wie vorgesehen funktioniert, und um die von unseren Kunden erwartete hohe Qualität liefern zu können“, erläutert Sanjay Gajendra, Chief Business Officer bei Astera Labs.

Wenn Astera nicht in der Lage ist, während des Chipdesign- und Verifizierungsprozesses genügend Simulationen durchzuführen, läuft das Unternehmen Gefahr, potenzielle Designfehler zu übersehen. „Wir haben nur eine Chance, und wenn wir einen Fehler machen, dauert es sechs bis neun Monate, bis der Fehler gefunden und das Problem behoben ist“, erklärt Gajendra. „Dieser Prozess ist sehr kostspielig und zeitaufwändig, was wir uns als Startup nicht leisten können.“

„Auf AWS konnten wir unser Chipdesign in weniger als einem Jahr fertigstellen, während es mit einer lokalen HPC-Umgebung Jahre gebraucht hätte.“

Sanjay Gajendra, Chief Business Officer, Astera Labs

  • Über Astera Labs
  • Astera Labs, Inc., ein Fabless-Halbleiterunternehmen mit Hauptsitz im kalifornischen Silicon Valley, entwickelt individuelle Konnektivitätslösungen für datenzentrische Systeme. Das Produktportfolio des Unternehmens umfasst systemfähige integrierte Halbleiterschaltungen, Platinen und Dienstleistungen, die eine robuste PCIe-Konnektivität ermöglichen.

  • Über Intel
  • Intel ist der weltweit führende Entwickler und Hersteller von Hochleistungsprozessoren für Server, PCs, IoT-Geräte und mobile Geräte. AWS- und Intel-Ingenieure arbeiten seit mehr als 10 Jahren zusammen und entwickeln kundenspezifische Hardware, um sicherzustellen, dass AWS-Services auf einer Plattform laufen, die für die Workloads der Kunden optimiert ist und das beste Preis-Leistungs-Verhältnis bietet. Die Amazon-EC2-Instances werden mit Intel-Xeon-Scalable-Prozessoren betrieben, die Unternehmen helfen, die Leistung ihrer rechenintensiven Workloads zu steigern.

  • Vorteile
    • Führt über Nacht mehr als 1.000 Chipdesign-Simulationen auf AWS durch
    • Ermöglicht die Fertigstellung des Chipdesigns in Monaten statt in Jahren
    • Ermöglicht das Einhalten von Fristen im Tape-Out-Prozess
    • Vermeidet monatelange und millionenschwere Fehlerkorrekturen im Chipdesign
  • Genutzte AWS-Services

Ausführung von HPC-Workloads auf AWS

Um potenziellen Herausforderungen bei der Einhaltung von Tape-Out-Fristen gewachsen zu sein, führt Astera seine HPC-Workloads seit der Gründung des Unternehmens in der Amazon Web Services (AWS) Cloud aus. „Wir waren der Ansicht, dass die öffentliche Cloud uns mehr Skalierbarkeit bieten und weniger kostspielig sein würde als der Kauf und die Wartung einer Serverfarm“, meint Gajendra. „Wir haben uns für AWS entschieden, weil wir es für in der Cloud-Branche führend halten und darauf vertrauen, dass wir unsere Risiken mithilfe der AWS-Services minimieren können.“

Astera arbeitete mit Six Nines, einem Premier-Beratungspartner aus dem AWS Partner Network (APN), zusammen, um eine HPC-Umgebung zur Unterstützung von Chipdesign- und Verifizierungssimulationen zu schaffen. Die Plattform läuft auf Tausenden von R5-, C5- und z1d-Instances in der Amazon Elastic Compute Cloud (Amazon EC2), die mit Intel-Xeon-Scalable-Prozessoren betrieben werden. Das Unternehmen nutzt die R5- und C5-Instances für physikalische Design- und Simulationsaufgaben und die z1d-Instances für langlaufende Simulationen, die die schnellstmöglichen virtuellen Maschinen erfordern. Astera verwendet auch Buckets aus dem Amazon Simple Storage Service (Amazon S3) zum Speichern von mehr als 100 TB an Daten.

Six Nines und AWS Professional Services halfen Astera dabei, die HPC-Plattform auf AWS in nur zwei Wochen zu implementieren, anstatt der drei Monate, die Astera für die Einrichtung der Plattform in einem Rechenzentrum gebraucht hätte, und die Umgebung wurde von AWS Professional Services entworfen und konfiguriert.

Parallele Ausführung Hunderter von Chipdesign-Simulationen

Astera kann nun Hunderte von Chipdesign-Simulationen parallel ausführen und die Designverifizierungszeit durch den Einsatz von AWS verkürzen. „Wir können ein sehr komplexes Chipdesign auf AWS implementieren“, sagt Gajendra. „AWS hat unsere Chipdesign- und Verifizierungsumgebung verbessert, sodass wir über die erforderlichen Rechenressourcen verfügen, um über Nacht mehr als 1.000 Simulationen durchzuführen. Das wäre in einem lokalen Rechenzentrum angesichts des Kapitalbedarfs nur sehr schwer zu realisieren.“ Mit seinen neuen Möglichkeiten war Astera in der Lage, das Tape-Out eines neuen Chips nach der PCIe-5.0-Spezifikation abzuschließen, die eine Bandbreite von 2 Tbits/sec über eine x16-Schnittstelle erreicht. Der Chip erfüllt die Anforderungen der Branche an Verbindungen mit hoher Bandbreite und geringer Latenz.

Dank AWS kann Astera auch schnell Fehler in einer virtuellen Umgebung erkennen und beheben, bevor ein Chipdesign zum Tape-Out geschickt wird. So konnte das Unternehmen das Chipdesign und den Verifizierungsprozess für seinen neuen Chip trotz des engen Zeitrahmens abschließen. „Auf AWS konnten wir unser Chipdesign in weniger als einem Jahr fertigstellen, während es mit einer lokalen HPC-Umgebung Jahre gebraucht hätte“, sagt Gajendra. „Durch Einsatz von AWS für die Skalierbarkeit der Cloud und die Bereitstellung der neuesten Instance-Typen zur Beseitigung von Engpässen für unsere Designer konnten wir unsere Zykluszeit für Designverifizierungsläufe und die physische Implementierung um den Faktor zwei oder mehr reduzieren.“ Darüber hinaus kann Astera aufgrund der von AWS ermöglichten Skalierbarkeit der Datenverarbeitung mehr Chipdesigns und qualitativ hochwertigere Produkte als seine Konkurrenten herstellen.

Vermeidung von Kosten in Millionenhöhe

Durch den effizienteren Chipentwicklungsprozess vermeidet Astera, dass nach einem Tape-Out mehrere Monate für die Korrektur von Fehlern und die Überarbeitung eines neuen Chipdesigns aufgewendet werden müssen. „Wir wollen nicht, dass unser Chip in der Produktion oder in den Systemen unserer Kunden ausfällt und wir Monate damit verbringen müssen, das Problem zu beheben“, erklärt Gajendra. „Wir können dieses Problem vermeiden, indem wir mit AWS ein qualitativ hochwertiges Tape-Out sicherstellen.“

Das Unternehmen profitiert auch vom Einsatz mehrerer AWS Availability Zones, mit denen eine hohe Verfügbarkeit seiner HPC-Umgebung während des Entwurfs und der Entwicklung gewährleistet werden kann. Gajendra sagt: „Insgesamt können wir mit AWS die strengen Fristen der Branche einhalten, die Erwartungen an die Geräteleistung erfüllen und uns weiterhin auf die Herstellung der bestmöglichen Chips konzentrieren.“

Weitere Informationen

Weitere Informationen erhalten Sie unter aws.amazon.com/hpc.