Genentech-Firmenlogo

Genentech maximiert den Wert klinischer Biomarker-Daten mithilfe von AWS

2022

Wenn die meisten Menschen an translationale Forschung denken, denken sie an die Übersetzung „vom Labortisch zum Krankenbett“ – Erkenntnisse, die im Labor beginnen und schließlich als neue Therapeutika oder Behandlungsstrategien ihren Weg in die Klinik finden. Im Zeitalter von Big Data in den Biowissenschaften können Forscher aber auch über eine „Rückübersetzung“ nachdenken, bei der in der Klinik gesammelte Informationen zu neuen Entdeckungen im Labor führen. Um diese Erkenntnisse zu gewinnen, müssen die klinischen Daten jedoch sicher, zugänglich, stabil und durchsuchbar sein – oft leichter gesagt als getan. 

„Man muss über die richtigen qualitativ hochwertigen Daten verfügen. Wenn man einen Haufen Mülldaten in einen ausgeklügelten Analysealgorithmus steckt, wird man immer noch Müll herausbekommen“, sagte Christina Lu, Leiterin der Abteilung Datenmanagement und Technik, Development Sciences Informatics bei Genentech. 

Genentech, ein Unternehmen der Roche-Gruppe, ist ein führendes Biotechnologie- und Pharmaunternehmen. Es hat eine Fülle realer biologischer Daten aus jahrelangen klinischen Studien und Forschungen gesammelt. Im Jahr 2017 implementierte die Entwicklungswissenschaftsgruppe von Genentech eine Strategie zur Optimierung dieser Daten für Forschung und Entwicklung. Ziel war es, wichtige Fragen wie „Was ist unser nächstes Arzneimittelziel?“ und „Wie können Daten aus abgeschlossenen klinischen Studien zukünftige Studienplanungen beeinflussen?“ zu beantworten. Diese Strategie beinhaltete den Aufbau eines Datenökosystems auf AWS-Plattformen, um Daten rückwirkend in durchsuchbaren Repositorys zu kuratieren und Tools und Prozesse für das zukünftige Datenmanagement einzuführen.

HCLS-Symposium 2021: Genentech, ein Mitglied der Roche-Gruppe (12:46)
kr_quotemark

Für die Analyse klinischer Daten, die früher Wochen dauerte, benötigen die Forscher jetzt nur noch wenige Stunden. Auf diese Weise sorgen wir dafür, dass jeder Datenpunkt zählt, um dem richtigen Patienten zum richtigen Zeitpunkt das richtige Medikament zu verabreichen.“

Christina Lu
Head of Data Management and Engineering, Development Sciences Informatics, Genentech

Datenkuration erschließt klinische Erkenntnisse

„Wir befinden uns an einem Wendepunkt in der klinischen Forschung – wenn man jetzt nicht über Daten verfügt, verpasst man tatsächlich wichtige Möglichkeiten, neue Behandlungen zu entwickeln und die Patientenversorgung zu verbessern“, sagte Lu. Im Fall von Genentech konzentrieren sich viele dieser Möglichkeiten auf die Analyse von Biomarkern – messbaren Molekülen im menschlichen Körper, die mit bestimmten biologischen Zuständen in Verbindung stehen – um Krankheitsprozesse und molekulare Mechanismen zu verstehen.

Das Ziel, „Daten an Ort und Stelle zu haben“, besteht darin, die Standards für FAIR zu erfüllen: auffindbar, zugänglich, interoperabel und wiederverwendbar (Findable, Accessible, Interoperable, Reusable). In einem Bericht aus dem Jahr 2018 wird geschätzt, dass allein die Wirtschaft der Europäischen Union 10,2 Milliarden Euro pro Jahr durch die Verwendung von Nicht-FAIR-Forschungsdaten einbüßt. Aber so wie es ist, verbringen Datenwissenschaftler bis zu 80 % ihrer Zeit damit, Daten von Hand zu sammeln, zu bereinigen und zu organisieren, obwohl ihr Fachwissen besser in der Erstellung von Modellen oder der Ausführung anderer spezialisierter Aufgaben eingesetzt werden sollte.

„Die Kuration älterer Daten ist kostspielig, zeitaufwändig und nicht skalierbar“, so Lu. Um Kosten zu sparen und Skalierbarkeit und Effizienz zu erreichen, hat Genentech bestehende Biomarker-Daten aus seinem Netzwerk von Auftragsforschungsinstituten (CROs) konsolidiert und in ein gut verwaltetes, zentralisiertes Repository übertragen, das auf Amazon Simple Storage Service (Amazon S3), einem Objektspeicherservice, gehostet wird. Dadurch erhalten Wissenschaftler und externe Forscher von Genentech einen optimierten Zugang zu einer größeren Menge an Informationen, was wiederum Studien, die neue Ziele für Gentherapien oder Krebsmedikamente aufdecken könnten, statistische Aussagekraft verleiht.

„Wenn wir diese Strategien zur Datenkuration prospektiv anwenden können, können wir viel mehr erreichen, um die menschliche Gesundheit zu beeinflussen“, sagte Lu.

Aufbau eines Datenökosystems auf AWS

„Das Biomarker-Daten-Repository, das wir auf AWS aufgebaut haben, enthält Petabytes an explorativen Biomarker-Daten und bietet eine Schnittstelle, über die Wissenschaftler die Daten, die sie für eine bestimmte Studie benötigen, leicht finden können“, sagte Lu.

Das Biomarker-Repository wird auf Amazon S3 gespeichert, während Amazon Relational Database Service (Amazon RDS), ein verwalteter relationaler Datenbankservice, die zugehörigen Metadaten verarbeitet, wobei die Indexierung und die schnelle Suche durch den Amazon Elasticsearch Service ermöglicht wird. Genentech verwendet das Amazon API Gateway, um APIs zu erstellen, die Forschern bei Bedarf einen sicheren, studienspezifischen Zugriff bieten.

„Dank dieser optimierten Architektur benötigen die Forscher für klinische Datenanalysen, die früher Wochen gedauert haben, jetzt nur noch wenige Stunden“, sagte Lu. „Auf diese Weise sorgen wir dafür, dass jeder Datenpunkt zählt, um dem richtigen Patienten zum richtigen Zeitpunkt das richtige Medikament zu verabreichen.“

Weitere Informationen


Über Genentech

Genentech, ein Unternehmen der Roche-Gruppe, ist ein Biotechnologie-Unternehmen, das sich der Entwicklung neuer Behandlungsmethoden für schwere und lebensbedrohliche Krankheiten verschrieben hat.

Vorteile von AWS

  • Sicher gespeicherte Petabytes an explorativen Biomarker-Daten
  • Kuratierte Daten sollen auffindbar, zugänglich, interoperabel und wiederverwendbar (FAIR) sein, sowohl rückwirkend als auch prospektiv


Genutzte AWS-Services

Amazon RDS

Amazon Relational Database Service (Amazon RDS) erleichtert Ihnen die Einrichtung, Verwaltung und Skalierung einer relationalen Datenbank in der Cloud.

Weitere Informationen »

Amazon S3

Amazon Simple Storage Service (Amazon S3) ist ein Objektspeicherservice, der branchenführende Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung bietet.

Weitere Informationen »

Amazon API Gateway

Amazon API Gateway ist ein vollständig verwalteter Service, der das Erstellen, Veröffentlichen, Warten, Überwachen und Sichern von APIs für Entwickler in jeder beliebigen Größenordnung vereinfacht.

Weitere Informationen »

AWS Lambda

AWS Lambda ist ein Computing-Service, mit dem Sie Anwendungen erstellen können, die schnell auf neue Informationen und Ereignisse reagieren.

Weitere Informationen »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) bietet die umfangreichste und tiefste Computing-Plattform mit über 500 Instances und einer Auswahl an neuesten Prozessoren, Speichern, Netzwerken, Betriebssystemen und Kaufmodellen, damit Sie die Anforderungen Ihres Workloads optimal erfüllen können.

Weitere Informationen »

Amazon Elasticsearch Service

Amazon Elasticsearch Service ist ein vollständig verwalteter Service, mit dem Sie Elasticsearch ohne Ausfallzeiten bereitstellen, sichern und ausführen können.

Weitere Informationen »


Erste Schritte

Unternehmen jeder Größe und aus jeder Branche transformieren ihr Geschäft mit AWS. Kontaktieren Sie unsere Experten und beginnen Sie noch heute Ihren Weg in AWS Cloud.