Kundenerfahrungen/Life Sciences

2022
Vertex-Logo

Vertex Pharmaceuticals senkt die Kosten für die Speicherung und Verarbeitung von Kryo-EM-Daten mithilfe von AWS um 50 %

Erfahren Sie, wie Vertex Pharmaceuticals die Wirkstoffforschung beschleunigt, indem das Unternehmen seine Kryo-EM-Workflows auf AWS ausführt.

2-fache

Verbesserung der Leistung

> 50 %

Senkung der Kosten

Mehrere Tage

Verbesserung der Datenverarbeitungszeiten

3 Monate

zur Fertigstellung des Prototyps der neuen Architektur

Verbesserte

Skalierbarkeit und verbesserte Produktivität

Übersicht

Vertex Pharmaceuticals (Vertex) ist ein globales Biotechnologieunternehmen, das in wissenschaftliche Innovationen investiert, um transformative Medikamente für Menschen mit schweren Krankheiten zu entwickeln. Vertex verwendet Kryoelektronenmikroskopie (Kryo-EM), um komplexe Bilder und Einblicke in die 3D-Struktur eines Proteins und die Struktur potenzieller Arzneimittelziele zu erzeugen. Durch diesen Prozess können die Chemiker des Unternehmens bessere Wirkstoffmoleküle entwickeln, indem sie ihre Struktur so optimieren, dass sie an ihre Ziele binden.
 
Kryo-EM-Workflows erfordern jedoch eine große Menge an Rechen- und Speicherressourcen. Wissenschaftler, die Analysen an mehreren Forschungsstandorten durchführen, generieren Petabyte an Daten. Vertex musste seine Infrastruktur skalierbar machen, um seinen wachsenden Anforderungen gerecht zu werden und gleichzeitig ausreichend Rechenleistung bereitzustellen, um die Forschung zu beschleunigen.
 
Vertex migrierte seine Datenspeicherung und -verarbeitung auf Amazon Web Services (AWS). Das Unternehmen nutzte mehrere AWS-Services, darunter Amazon Elastic Compute Cloud (Amazon EC2), das sichere und anpassbare Rechenkapazitäten zur Unterstützung praktisch aller Workloads bietet. Vertex verbesserte die Leistung seiner High Performance Computing (HPC)-Workloads, beschleunigte Datenanalysen und machte sein System skalierbar und senkte gleichzeitig die Gesamtspeicher- und Rechenkosten um über 50 Prozent.
Scientist Working on Computer In  Modern LaboratoryNOTE TO INSPECTOR: all graps, dna models, charts are made by me

Gelegenheit | Beschleunigung der Verarbeitungsleistung von Kryo-EM-Workflows zur schnelleren Generierung von Erkenntnissen 

Vertex verwendet Kryo-EM, um Behandlungsmethoden für Krankheiten zu entdecken, indem die molekulare Struktur potenzieller Wirkstoffziele analysiert wird. „Kryo-EM hilft uns dabei, eine ausreichende Auflösung für tiefere Einblicke in Proteinstrukturen zu erhalten, die wir noch vor wenigen Jahren nicht untersuchen konnten“, sagt David Posson, leitender Forscher bei Vertex Pharmaceuticals.
 
Diese fortschrittliche Technologie hat zwar das Potenzial für neue Entdeckungen und Behandlungen eröffnet, aber auch der Bedarf an Speicher- und Rechenkapazität ist gestiegen. „Der Betrieb eines Mikroskops für Kryo-EM generiert täglich Terabyte an Daten“, sagt Roberto Iturralde, leitender Direktor für Softwaretechnik bei Vertex Pharmaceuticals. „Es ist üblich, 1 PB an Daten in einem Jahr zu generieren.“ Darüber hinaus benötigen Wissenschaftler schnelle Erkenntnisse. Die On-Premises-Infrastruktur von Vertex für die Ausführung seiner Kryo-EM-Workloads hatte Schwierigkeiten, mit den schnell wachsenden Rechen- und Speicheranforderungen Schritt zu halten.
 
Vertex musste zunächst alle Daten von Mikroskopen in externen Einrichtungen mithilfe von Festplatten in sein Rechenzentrum übertragen, was Wochen in Anspruch nahm. Als neue Daten eingingen, konnten die On-Premises-HPC-Cluster des Unternehmens die Aktivitätsschübe nicht effizient bewältigen. Sie konnten auch in Zeiten geringer Aktivität den Betrieb nicht herunterskalieren.
 
Die langfristige Speicherung von Daten stellte eine weitere Herausforderung dar. Nach einigen Wochen griffen Wissenschaftler nur noch selten auf die älteren Mikroskopdaten zu. Die On-Premises-Umgebung von Vertex wurde jedoch nicht optimiert, um aufgrund von Nutzungs- und Zugriffsmustern Kosten zu sparen. Da sich der Bereich schnell entwickelte, wurde es teuer, mit den kontinuierlichen Hardware-, Software-, Netzwerk- und Sicherheitsupgrades Schritt zu halten, die für die Verwaltung der On-Premises-Kryo-EM-Infrastruktur erforderlich waren. Anfang 2022 erkannte Vertex, dass es eine elastischere Lösung mit besserer Leistung benötigte.
 
Vertex verwendet AWS bereits seit 2015 für verschiedene Workloads. Inspiriert von den neuen Funktionen, die auf der AWS re:Invent 2021 vorgestellt wurden, hat Vertex seinen gesamten Kryo-EM-Workload neu gestaltet und auf AWS migriert. Das Unternehmen hat in nur 3 Monaten einen Prototypen der neuen Architektur erstellt. „AWS verfügt über das breiteste und umfassendste Angebot an cloudnativen Technologien, die wir bei Vertex einsetzen wollen“, sagt Iturralde. „Mit AWS haben wir schnell auf ein neues Design umgestellt, das den sich ändernden Anforderungen unserer Wissenschaftler besser entsprach.“
kr_quotemark

Durch die Arbeit an AWS können wir mehr Zeit damit verbringen, uns darauf zu konzentrieren, wie wir innovativ sein können. Wir können kreativ sein und die Vorteile der Cloud nutzen, um unsere Wissenschaft zu beschleunigen.“

Roberto Iturralde
Senior Director of Software Engineering, Vertex Pharmaceuticals

Lösung | Reduzierung der Datenspeicherkosten und Beschleunigung der Verarbeitung mithilfe von AWS ParallelCluster 

Durch die Migration auf AWS migrierte Vertex seine Workloads näher an den Ort, an dem die Daten in Amazon Simple Storage Service (Amazon S3) eingetroffen sind – einem Objektspeicher-Service, der branchenführende Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung bietet. Vertex verwendet auch Amazon FSx für Lustre, einen vollständig verwalteten gemeinsam genutzten Speicher, der auf einem der weltweit beliebtesten Hochleistungsdateisysteme basiert, um Wissenschaftlern genau die Menge an Speicherressourcen zur Verfügung zu stellen, die sie während der aktiven Analyse benötigen.

Nach der Verarbeitung sendet Vertex die Daten zurück an Amazon S3. Das Unternehmen sortiert Daten effizient mithilfe der Amazon-S3-Lifecycle-Richtlinien. Dabei handelt es sich um Regeln, die Aktionen definieren, die Amazon S3 auf eine Gruppe von Objekten anwendet. „Mithilfe der Amazon-S3-Lifecycle-Richtlinien können wir Daten verschiedenen Ebenen zuordnen, um die Speicherkosten zu senken“, sagt Iturralde. Das Unternehmen kann seinen Speicher auch nahtlos skalieren, wodurch der Aufwand für das Rechenzentrum begrenzt wird.

Für die Verwaltung von Rechenleistung für die Datenverarbeitung verwendet Vertex AWS ParallelCluster, ein Open-Source-Cluster-Management-Tool, mit dem sich elastische HPC-Cluster auf AWS einfach bereitstellen und verwalten lassen. Es wird HPC-Knoten je nach den Anforderungen der Analysesoftware hoch- und herunterfahren. „Wenn sie fertig sind, können wir wieder fast nichts zahlen“, sagt Iturralde. „Wir müssen uns keine Sorgen machen, dass das Tempo der Wissenschaft unsere Ressourcen überfordert oder unsere Aufmerksamkeit auf die Instandhaltung der Infrastruktur lenkt.“

Durch die Anpassung der Rechenkosten an die Workload-Anforderungen hat Vertex die Kosten um 50 Prozent gesenkt. Darüber hinaus wurde eine zweimal bessere Leistung als seine vorherige Architektur erzielt. Und Vertex hat die Engpässe beseitigt, mit denen sein Kryo-EM-Team in der On-Premises-Umgebung konfrontiert war, als es Ressourcen mit anderen Gruppen gemeinsam nutzte, was häufig der Fall war. „Bisher dauerte die Analyse von Kryo-EM-Daten mehrere Wochen, auch wenn niemand sonst Ressourcen nutzte“, sagt Posson. „Jetzt können wir mit AWS zuverlässig Daten in weniger als einer Woche liefern.“

Vertex hat mithilfe von Amazon Cognito native Single-Sign-On-Unterstützung hinzugefügt, mit der Unternehmen schnell und einfach Registrierung, Anmeldung und Zugriffskontrolle für Web- und mobile Apps hinzufügen können. „Die Verwendung von Amazon Cognito bietet uns den zusätzlichen Komfort, dass nur die entsprechenden Mitarbeiter Zugriff auf die Software haben“, sagt Iturralde. Darüber hinaus verwendet Vertex Application Load Balancer, der den HTTP- und HTTPS-Datenverkehr mit fortschrittlichem Routing von Anforderungen ausgleicht, das auf die Bereitstellung moderner Anwendungen abzielt, um sein Netzwerk zu sichern.

Auf AWS hat Vertex seine Prozesse effizient, skalierbar und kostengünstig gestaltet und gleichzeitig den manuellen Wartungsaufwand reduziert. Die Nutzung von AWS bedeutet auch, dass das Unternehmen Zugriff auf die neuesten Rechen- und GPU-Ressourcen hat, ohne die monatelange Vorlaufzeit, die mit der Beschaffung von Rechenzentrum-Hardware verbunden ist. Auf Vertex werden beispielsweise Amazon-EC2-G5-Instances ausgeführt, die eine leistungsstarke Kombination aus CPU-, Hostspeicher- und GPU-Kapazität bieten. Durch die Durchführung von Kryo-EM-Prozessen in der Cloud können Wissenschaftler Analysen nahezu in Echtzeit durchführen. Vertex nutzt teure Mikroskop-Zeit effizienter und ermöglicht wissenschaftliche Durchbrüche.

Ergebnis | Schnellere Datenverarbeitung zur Beschleunigung von Recherchen mit Amazon EC2 

Vertex hat den Zeitaufwand für die Bereitstellung von Analyseergebnissen bereits reduziert und hofft, dies weiter beschleunigen zu können. „Mit Live-Verarbeitung könnten wir die Analyse sofort starten, sobald die Daten aus dem Mikroskop kommen“, sagt Posson. „Möglicherweise können wir unseren einwöchigen Zeitplan halbieren.“
 
Vertex plant außerdem, seine HPC-Infrastruktur weiter elastischer und cloudnativer zu gestalten, um Kosten zu sparen. „Durch die Arbeit an AWS können wir mehr Zeit damit verbringen, uns darauf zu konzentrieren, wie wir innovativ sein können“, sagt Iturralde. „Wir können kreativ sein und die Vorteile der Cloud nutzen, um unsere Wissenschaft zu beschleunigen.“

Über Vertex Pharmaceuticals

Vertex ist ein Pharmaunternehmen mit Hauptsitz in Boston, das komplexe Moleküle untersucht und Behandlungen für schwere Krankheiten mit den neuesten Mikroskopietechnologien auf der ganzen Welt erforscht.

Genutzte AWS-Services

Amazon S3

Amazon Simple Storage Service (Amazon S3) ist ein Objektspeicher-Service mit branchenführender Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung.

Weitere Informationen »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) bietet sichere und anpassbare Rechenkapazität für praktisch jeden Workload.

Weitere Informationen »

AWS ParallelCluster

AWS ParallelCluster ist ein Tool für Open-Source-Cluster-Management, das Ihnen die Bereitstellung und Verwaltung von High-Performance-Computing (HPC)-Clustern auf AWS erleichtert.

Weitere Informationen »

Amazon FSx für Lustre

Amazon FSx für Lustre bietet vollständig verwalteten geteilten Speicher mit der Skalierbarkeit und Leistung des beliebten Lustre-Dateisystems.

Weitere Informationen »

Erste Schritte

Organisationen aller Größen aus verschiedenen Sektoren transformieren ihre Unternehmen und erfüllen ihre Missionen täglich mithilfe von AWS. Kontaktieren Sie unsere Experten und begeben Sie sich noch heute Ihren Weg zu AWS.