23andMe-Logo

23andMe führt innovative Arzneimittel- und Therapieforschung mit HPC auf AWS ein

2022

Das Genomik- und Biotechnologie-Unternehmen 23andMe bietet Gentests direkt an Kunden an und gibt ihnen wertvolle Einblicke in ihre Genetik. 23andMe benötigte mehr Skalierbarkeit und Flexibilität für sein High Performance Computing (HPC), um mehrere Petabyte an Daten effizient zu verwalten. Das Unternehmen hatte zuvor eine On-Premises-Lösung verwendet, begann jedoch 2016, Amazon Web Services (AWS) zum Speichern wichtiger Daten zu verwenden. Im Jahr 2021 führte das Unternehmen eine vollständige Migration in die Cloud durch, ein Prozess, der nur 4 Monate dauerte. Seit der Einführung von AWS-HPC-Services, darunter Amazon Elastic Compute Cloud (Amazon EC2), das sichere und skalierbare Rechenkapazität für praktisch jeden Workload bietet, und AWS Batch, mit dem Entwickler, Wissenschaftler und Ingenieure Hunderttausende von Batch-Computing-Jobs auf AWS einfach und effizient ausführen können, hat 23andMe seine Skalierbarkeit, Flexibilität und Kostenoptimierung verbessert.

case-study-600x300
kr_quotemark

Um ein Gefühl für die Skalierbarkeit zu vermitteln, haben wir einen Datenverarbeitungsauftrag zu Spitzenzeiten ausgeführt, bei dem über 80 000 virtuelle CPUs gleichzeitig im Einsatz waren. Die Verwendung von Amazon EC2 hat den Ressourcenkonflikt für die Forscher von 23andMe gelöst.“

Arnold de Leon
Sr. Programmmanager, 23andMe

 

Nutzung der Cloud für sichere Datenspeicherung

23andMe hat seinen Hauptsitz in Kalifornien und ist bekannt für seine DNA-Sammelkits für zu Hause. Das Unternehmen nutzt seine Datenbank mit genetischen Informationen auch, um sein Verständnis von Biologie und Therapeutik zur Entwicklung neuer Medikamente und Therapien zu verbessern. 23andMe wurde 2006 gegründet, hat eine enorme Datenmenge gesammelt und Millionen von Codezeilen für seine Forschung und Therapeutik generiert. Sie verwenden diese Daten für Regressionsanalysen, genomweite Assoziationsstudien und allgemeine Korrelationsstudien über Datensätze hinweg. Der Markt für Gentests hat aufgrund der zunehmenden Prävalenz genetischer Krankheiten, des besseren Bewusstseins der Öffentlichkeit für die Vorteile der Früherkennung und der sinkenden Kosten der genetischen Sequenzierung in den letzten 16 Jahren an Dynamik gewonnen.
 
23andMe nutzte anfänglich eine On-Premises-Einrichtung, aber als die Anforderungen an Datenspeicher und Datenverarbeitung zunahmen, begann das Unternehmen, in der Cloud nach größerer Skalierbarkeit und Flexibilität zu suchen. Darüber hinaus war das Unternehmen bestrebt, die Personalkosten für die Wartung von Anlagen zu senken und durch die Umstellung auf die Cloud die Einführung neuer Hardware und Technologien zu beschleunigen. Im Jahr 2016 begann das Unternehmen, Amazon Simple Storage Service (Amazon S3) zu nutzen, einen Objektspeicherservice, der Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung bietet. „Wenn uns ein Datenelement wichtig ist, speichern wir es in Amazon S3“, sagt Arnold de Leon, Programmmanager, der bei 23andMe für Cloud-Ausgaben zuständig ist. „Es ist eine hervorragende Möglichkeit, Daten im Hinblick auf die Datenbeständigkeit zu sichern.“ 23andMe verwendet die Amazon-S3-Intelligent-Tiering-Speicherklasse, um Daten automatisch auf die kostengünstigste Zugriffsstufe zu migrieren, wenn sich die Zugriffsmuster ändern.
 
Zu Beginn der Nutzung von Cloud-Services versuchte 23andMe eine Hybridlösung, bei der Workloads gleichzeitig in seinem Rechenzentrum und auf AWS ausgeführt wurden. Diese Lösung bot eine gewisse Skalierbarkeit, war jedoch mit den damit verbundenen Kosten für die Hin- und Hermigration von Daten zwischen dem On-Premises-Rechenzentrum und der Cloud verbunden. Um eine bessere Kostenoptimierung zu erreichen und gleichzeitig mehr Flexibilität und Skalierbarkeit zu erreichen, beschloss 23andMe, 2021 vollständig auf AWS zu migrieren.

Optimieren der Ausführung von HPC auf AWS

23andMe nutzte das AWS Migration Acceleration Program (AWS MAP), ein umfassendes und bewährtes Cloud-Migrationsprogramm, das auf der Erfahrung von AWS bei der Migration von Tausenden von Unternehmenskunden zur Cloud basiert. Mit AWS MAP konnte 23andMe in nur 4 Monaten eine reibungslose Migration erreichen. „AWS MAP bot uns die Möglichkeit, eine schnelle, massive Umstellung durchzuführen“, sagt de Leon. „Normalerweise ist das sehr teuer, aber AWS MAP hat dieses Problem gelöst.“ 23andMe migrierte alles aus seinem Rechenzentrum in die Cloud auf AWS. Ein Jahr nach der Migration zu AWS, als das AWS-MAP-Programm für 23andMe ausläuft, erzielt 23andMe aufgrund der Sorgfalt des Teams bei der Einführung von AWS-Services eine gleiche oder bessere Preisleistung.

Die Verwaltung der dateibasierten Stammverzeichnisse von Wissenschaftlern stellte eine weitere Herausforderung dar. Um dieses Problem zu lösen, wandte sich 23andMe an Weka, einen AWS-Partner. Das parallele WekaIO-Dateisystem ist funktionell, kostengünstig und mit Amazon S3 kompatibel. Dies half dem internen Team von 23andMe, Änderungen umzusetzen, ohne das Kundenerlebnis zu beeinträchtigen. Nach Abschluss der Migration begann 23andMe, AWS-Services für HPC wie Amazon-EC2-C5-Instances zu nutzen, die kostengünstige Hochleistung zu einem niedrigen Preis-/Rechenverhältnis für die Ausführung anspruchsvoller rechenintensiver Workloads bieten. Es entschied sich für diesen Amazon-EC2-Instance-Typ, da er seinen vorherigen Rechenressourcen am nächsten kam.

23andMe entdeckte schnell die Vorteile, die sich daraus ergeben, dass eine Vielzahl von Amazon-EC2-Instance-Typen zur Verfügung stellt. „Wir haben die gesamte Palette der Amazon-EC2-Angebote zur Verfügung, und eine Möglichkeit, Effizienz zu erzielen, besteht darin, eine optimale Lösung für die Ressourcennutzung zu finden“, sagt Justin Graham, Manager einer Gruppe für Infrastrukturtechnik bei 23andMe. Seit 2022 nutzt das Unternehmen viele Instance-Typen flexibel, darunter Amazon-EC2-X2i-Instances, die nächste Generation speicheroptimierter Instances, die Verbesserungen in Bezug auf Leistung, Preis-Leistungs-Verhältnis und Kosten für speicherintensive Workloads bieten. 23andMe verwendet AWS Batch auch, um Ressourcen zur Anpassung der Größe und des Abgleichs bereitzustellen, um zu bestimmen, welche Instance-Typen verwendet werden sollen, was bei der Optimierung des Preis-Leistungs-Verhältnisses hilft.

23andMe kann bei Bedarf skalieren, um der Rechenkapazität für die tatsächlichen Workloads gerecht zu werden, und dann wieder herunterskalieren. „Um ein Gefühl für die Skalierbarkeit zu vermitteln, haben wir einen Datenverarbeitungsauftrag zu Spitzenzeiten ausgeführt, bei dem über 80 000 virtuelle CPUs gleichzeitig im Einsatz waren“, sagt de Leon. Darüber hinaus hat die Verwendung von Amazon-EC2-Instances den Ressourcenkonflikt für die Forscher von 23andMe gelöst. „Kürzlich hatten wir ein 3-wöchiges Produktions-Workload, das 33 Prozent früher als geplant fertig war. Seit der Migration zu AWS ist unsere Fähigkeit, Rechenressourcen für unsere Forscher bereitzustellen, unübertroffen“, sagt Graham.

23andMe genießt zwar diese Vorteile der Nutzung von HPC-Services auf AWS, musste aber bei seinen ursprünglichen Ausgabenzielen keine Kompromisse eingehen. „Unser Ziel war es, unsere Kosten gleich zu halten, aber an Flexibilität, Leistungsfähigkeit und Wert zu gewinnen. Bei Einsparungen geht es weniger um den Saldo als vielmehr darum, was wir für das, was wir ausgeben, gewinnen“, sagt de Leon. 23andMe hat durch die Nutzung einer Vielzahl von AWS-Services, darunter Amazon Relational Database Service (Amazon RDS), eine Sammlung von Managed Services, die die Einrichtung, den Betrieb und die Skalierung von Datenbanken in der Cloud vereinfachen, sowie Amazon EC2, eine Steigerung der Kostenoptimierung erreicht. 23andMe setzt voll und ganz auf AWS und ist bestrebt, das Preis-Leistungs-Verhältnis seiner Workloads weiter zu optimieren.

Erkunden von zukünftigen Möglichkeiten mit Flexibilität auf AWS

23andMe konnte seine bestehende Umgebung praktisch ohne Änderungen migrieren und begann im Laufe der Zeit, mehr AWS-Services in seine Lösung zu integrieren. Das Unternehmen sucht nach weiteren Möglichkeiten, die Kosten mithilfe von AWS zu optimieren, und untersucht Services wie den AWS-Graviton-Prozessor, der ein hervorragendes Preis-Leistungs-Verhältnis für Cloud-Workloads bietet, die in Amazon EC2 ausgeführt werden. Das Unternehmen sucht nach Möglichkeiten, kostenoptimal zu wirtschaften und gleichzeitig die Ressourcen beizubehalten, die es für On-Demand-Computing benötigt. „Die Migration ist etwa 10 Monate her, und das letztendliche Ziel ist es, einen schnelleren Prozess von der Idee bis zur Validierung voranzutreiben. Unsere Forscher sind schneller und effizienter, und wir hoffen auf einen großen Durchbruch in der Forschung“, sagt de Leon. 


Über 23andMe

23andMe, ein Genomik- und Biotechnologie-Unternehmen mit Sitz in Kalifornien, stellt seinen Kunden genetische Informationen zur Verfügung und hat Milliarden von Datenpunkten für Studien gesammelt, was zu wissenschaftlichen Entdeckungen geführt hat.

Vorteile von AWS

  • Reibungslose Migration in die Cloud innerhalb von 4 Monaten
  • Beseitigung des Rechenressourcen-Konflikts unter Forschern
  • Verbesserte Skalierbarkeit, Unterstützung eines Datenverarbeitungsauftrags, der auf mehr als 80 000 virtuellen CPUs ausgeführt wird
  • Höhere Effizienz, da ein 3-wöchiges Produktions-Workload 33 % früher als geplant abgeschlossen wurde
  • Optimierte Kosten

Genutzte AWS-Services

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) bietet die umfangreichste und tiefste Computing-Plattform mit über 500 Instances und einer Auswahl an neuesten Prozessoren, Speichern, Netzwerken, Betriebssystemen und Kaufmodellen, damit Sie die Anforderungen Ihres Workloads optimal erfüllen können.

Weitere Informationen »

Amazon S3

Amazon Simple Storage Service (Amazon S3) ist ein Objektspeicher-Service mit branchenführender Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung.

Weitere Informationen »

Amazon MAP

Das AWS Migration Acceleration Program (MAP) ist ein umfassendes und bewährtes Cloud-Migrationsprogramm, das auf der Erfahrung von AWS bei der Migration von tausenden Unternehmenskunden zur Cloud basiert.

Weitere Informationen »

AWS Batch

AWS Batch ermöglicht es Entwicklern, Wissenschaftlern und Ingenieuren, mit AWS einfach und effizient unzählige Batchdatenverarbeitungsaufträge durchzuführen.

Weitere Informationen »


Erste Schritte

Organisationen aller Größen aus verschiedenen Sektoren transformieren und erfüllen ihre Missionen täglich mithilfe von AWS.
Kontaktieren Sie unsere Experten und beginnen Sie noch heute Ihren Weg in AWS Cloud.