AstraZenecas Genomik-Datenverarbeitungslösung führt in 1 Tag 51 Milliarden Tests in AWS aus

2021

Rund 20 Jahre nach der Veröffentlichung des ersten menschlichen Genoms wandelt sich die Genomik von einer forschungslastigen Praxis zu einem Motor für die personalisierte Medizin. Das weltweit tätige biopharmazeutische Unternehmen AstraZeneca engagiert sich für diesen Wandel, indem es die Verwendung der Genomik in der Präzisionsmedizin beschleunigt und die Umsetzung der Genomik zur Umgestaltung der Arzneimittelforschung vorantreibt.

AstraZeneca verwendet Petabytes an genomischen Sequenzierungsdaten, um die Arzneimittelforschung und -entwicklung zu unterstützen. AstraZeneca verwendete Amazon Web Services (AWS), um Daten schnell und in großem Umfang zu verarbeiten und eine schnelle, effiziente Lösung für die Gewinnung aussagekräftiger Genomikerkenntnisse zu entwickeln.

AstraZeneca Genomics in AWS: Eine Reise von Petabytes zu neuen Medikamenten (1:19)
kr_quotemark

Mit diesen Fähigkeiten haben wir im Jahr 2020 genetische Beiträge zu mehr als 40 der Arzneimittelforschungsprojekte von AstraZeneca geliefert.“

Slavé Petrovski
VP, Head of Genome Analytics and Informatics, Centre for Genomics Research, R&D, AstraZeneca

Entwicklung einer Lösung, die Wissenschaftlern Innovationsmöglichkeiten bietet

AstraZeneca wollte nicht nur schnell Erkenntnisse aus genomischen Daten gewinnen, sondern auch Ressourcen für die wissenschaftliche Erforschung bereitstellen und vermeiden, dass die Bioinformatik Zeit für relativ geringwertige Datenverwaltungsaktivitäten verschwendet. Da das Unternehmen Petabytes an Daten aus verschiedenen Quellen in großen Mengen sammelt, benötigte es leistungsstarke, skalierbare Computing-Kapazitäten.

Nachdem AstraZeneca bereits in AWS entwickelt hatte, beschloss das Unternehmen, seine Verwendung von AWS-Tools zu erweitern, um eine cloudbasierte Bioinformatiklösung für die schnelle Genomverarbeitung und -analyse zu entwickeln.

Automatisierung in AWS, um schnelle Einblicke zu erhalten

Die Hochdurchsatzlösung von AstraZeneca führt viele Vorgänge der genomischen Datenverarbeitung und -analyse durch. Die genomische Sekundäranalyse befasst sich mit den Rohdaten der Sequenzierung, um ein Genom zu rekonstruieren und genomische Varianten zu identifizieren, die in späteren Phasen weiter analysiert werden können. Um die Datenorchestrierung dieser Schritte zu automatisieren, benutzt die Architektur AWS Lambda, einen Serverless-Computing-Service, der es Benutzern ermöglicht, Code auszuführen, ohne Server bereitstellen oder verwalten zu müssen. Um eine Ebene für die Ausführung von Aufgaben zu entwickeln, verwendet die Architektur AWS Batch, das dynamisch die optimale Menge und den optimalen Typ von Computing-Ressourcen bereitstellt, z. B. CPU- oder speicheroptimierte Instances, je nach dem Volumen und den spezifischen Ressourcenanforderungen der eingereichten Batch-Aufträge. Dabei werden die Daten mit dem Amazon Simple Storage Service (Amazon S3), einem Objektspeicher-Service, in Buckets sortiert.

In AWS konnte AstraZeneca die Produktivität durch Skalierung, Rechenleistung und Zugriff auf umfangreiche technologische Services beschleunigen und verbessern. Da das Unternehmen bei Bedarf Analysen in großem Maßstab durchführen kann, stehen die Daten schneller für Analysen zur Verfügung. „Wir können jetzt über 51 Milliarden statistische Tests in weniger als 24 Stunden durchführen und dabei die Auswirkungen einzelner Mutationen oder einzelner Gene mit einem breiten Spektrum von Phänotypen untersuchen“, sagt Slavé Petrovski, VP, Leiter der Genomanalytik und Informatik am Centre for Genomics Research von AstraZeneca. Die Bemühungen des Unternehmens zeigen Wirkung. „Mit diesen Fähigkeiten haben wir im Jahr 2020 genetische Beiträge zu mehr als 40 der Arzneimittelforschungsprojekte von AstraZeneca geliefert.“

Antrieb der wissenschaftlichen Innovation

AstraZeneca hat eine schnelle, effiziente Genomik-Bioinformatik-Pipeline entwickelt, die den Wissenschaftlern des Unternehmens die Zeit und die Ressourcen gibt, um Innovationen zu verfolgen. Dank dieser Pipeline nähert sich das Zentrum für Genomforschung des Unternehmens seinem Ziel, bis 2026 zwei Millionen Genome zu analysieren.


Über AstraZeneca

AstraZeneca ist ein globales biopharmazeutisches Unternehmen, das innovative Arzneimittel in einer Reihe von Therapiebereichen entwickelt. Das Centre for Genomics Research ist eine Initiative von AstraZeneca mit dem Ziel, bis 2026 zwei Millionen Genome zu analysieren.

Vorteile von AWS

  • Unterstützung der Durchführung von über 51 Milliarden statistischen Tests in weniger als 24 Stunden
  • Erleichterung der Bereitstellung genomischer Erkenntnisse für mehr als 40 Arzneimittelforschungsprojekte im Jahr 2020
  • Hochskalierung zur Anpassung an die sprunghafte Nachfrage nach genomischer Sequenzierung
  • Freisetzung von Ressourcen für die wissenschaftliche Erforschung

Genutzte AWS-Services

AWS Lambda

AWS Lambda ist ein Serverless-Computing-Service, mit dem Sie Code ausführen können, ohne Server bereitstellen oder verwalten, eine für die Workload geeignete Clusterskalierungslogik erstellen, Ereignisintegrationen pflegen oder Laufzeiten verwalten zu müssen.

Weitere Informationen »

AWS Batch

AWS Batch ermöglicht es Entwicklern, Wissenschaftlern und Ingenieuren, mit AWS einfach und effizient unzählige Batchdatenverarbeitungsaufträge durchzuführen.

Weitere Informationen »

Amazon S3

Amazon Simple Storage Service (Amazon S3) ist ein Objektspeicherservice, der branchenführende Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung bietet.

Weitere Informationen »


Erste Schritte

Unternehmen jeder Größe und aus jeder Branche transformieren ihr Geschäft mit AWS. Kontaktieren Sie unsere Experten und beginnen Sie noch heute damit, AWS Cloud kennen zu lernen.