Life Sciences |
Für Amazon Web Services anmelden |
Kostenreduzierung und rasante technologische Innovation haben zu einem starken Wachstum von Umfang und Durchsatz biologischer Daten geführt, die von großen Forschungsinstituten, einzelnen Labors und Biopharmaunternehmen erzeugt werden. Zugleich ist die Forschung im Bereich Life Sciences zunehmend kollaborativ und durch seine Komplexität geprägt. In diesem Bereich wird mit den verschiedensten Technologien das systemische Verständnis von Krankheiten und Organismen vertieft. Durch den exponentiellen Zuwachs der erzeugten Datenmengen und die zunehmend kollaborative Ausrichtung muss die Art und Weise, wie Daten gespeichert, analysiert und gemeinsam genutzt werden, neu überdacht werden.
Forscher, Informatiker, Softwareentwickler und IT-Abteilungen in Life-Sciences-Unternehmen nutzen jetzt Amazon Web Services (AWS) zur Erstellung von skalierbaren und hochverfügbaren IT-Infrastrukturen, in denen Terabytes (häufig sogar Petabytes) an Daten gespeichert, verarbeitet und gemeinsam genutzt werden können.
AWS Public Data Sets stellen ein zentralisiertes Repository zur Verfügung, in dem diese Daten gemeinsam genutzt und nahtlos in AWS Cloud-basierte Anwendungen integriert werden können. Ein Beispiel hierfür ist das 1000-Genome-Projekt, ein internationales öffentlich-privates Konsortium, das an dem bislang detailliertesten Verzeichnis menschlicher Genvariationen arbeitet.
Elastisch. Mit AWS können Sie die Kapazität innerhalb von wenigen Minuten erhöhen oder verringern. Sie können eine, Hunderte oder sogar Tausende Server-Instanzen gleichzeitig in Betrieb nehmen.
Freigabe und Zusammenarbeit. In einem gemeinsamen Raum können Sie Daten, Ergebnisse und Methoden mit anderen Forschern gemeinsam nutzen.
Pipeline-Verteilung. Entwickeln Sie hochverfügbare Webanwendungen, über die Sie anderen Benutzern Services und Pipelines anbieten. Stellen Sie Amazon Machine Images (AMIs) bereit, mit denen bewährte Pipelines und neue Techniken eingekapselt werden.
Kostengünstig. Mit dem Preismodell ohne Grundkosten können Sie Ihre Betriebskosten mit Ihren Anforderungen auf Linie bringen. So zahlen Sie nicht mehr für Ausstattung, die zwischen Experimenten ungenutzt bleibt.
Sicher. Sie haben die Kontrolle darüber, wer auf Daten zugreift, sie ansieht, bearbeitet, hinzufügt oder löscht. Sie können Zugriffsprotokolle erstellen und durch Benachrichtigungen überwachen.
Konzentration auf die Wissenschaft. Konzentrieren Sie sich auf Ihre Wissenschaft und machen Sie sich keine Sorgen darüber, wie verteilte Infrastrukturen im großen Stil errichtet werden.
Pharmaunternehmen, Biotech-Unternehmen, Forschungszentren und akademische Laboratorien können mit AWS einige der wichtigsten Herausforderungen ihrer IT-Infrastruktur in Angriff nehmen.
Genomsequenzierung und Datenverteilung
Inzwischen sind kostengünstige Instrumente mit hoher Durchsatzrate für die Genomsequenzierung verfügbar, wodurch mühelos enorme Mengen Genomsequenzdaten produziert werden. Da Sequenzierungsexperimente für gewöhnlich parallel verlaufen, wird die Geschwindigkeit der Experimentdurchführung durch den Zugriff auf Rechenressourcen gedrosselt.
Amazon S3 bietet ein hochskalierbares, hochverfügbares und äußerst zuverlässiges Datenspeichersystem für die Speicherung und Verteilung von Genomsequenzdaten. Amazon EC2 bietet hochskalierbare Rechenressourcen, mit denen verschiedene Anwendungen zum Zusammensetzen, Zuordnen und Abgleichen ausgeführt werden können. Durch die enge Verzahnung von Amazon S3 und Amazon EC2 steht eine Verbindung mit hoher Bandbreite für die Übertragung von Eingabedaten und die zuverlässige Speicherung von Ausgabedaten zur Verfügung. Für die Übertragung von Daten zwischen Amazon EC2 und Amazon S3 innerhalb derselben Region fallen keine zusätzlichen Bandbreitenkosten an.
AWS bietet verschiedene Optionen für die Datenaufnahme und Datenverteilung. Bei kleineren Datensätzen (< ~1 TB) werden die Daten für gewöhnlich über unsere Web-API in Amazon S3 eingespielt. Bei größeren Genomdatensätzen werden die Daten für gewöhnlich auf physischen Speichermedien über AWS Import in AWS verschoben oder durch die Nutzung einer WAN-optimierten Software, die auf einer Amazon EC2-Instance ausgeführt wird. Die Daten können direkt aus Amazon S3 heraus verteilt werden. Wenn die Verzögerungszeit möglichst gering gehalten werden soll, erfolgt die Verteilung über das Netzwerk zur Inhaltsbereitstellung CDN von Amazon CloudFront. Bei besonders großen Datensätzen können die Daten über den Dienst AWS Import/Export aus AWS auf physische Speichermedien verschoben werden.
Bioinformatik
Die Analyse von Genom- und Proteomdaten erfordert häufig innerhalb kurzer Zeit Zugriff auf große Mengen Rechenressourcen. Amazon EC2 bietet eine elastische Rechenumgebung, mit der Forscher große Datenmengen aus verschiedenen biologischen Analysen verarbeiten können.
Sowohl für die Analyse als auch für die Verarbeitung stehen verschiedene Optionen zur Datenspeicherung zur Verfügung, die vom Anwendungsfall abhängig sind. Amazon S3 ist für das Streaming von Objektdaten in Arbeitsknoten zur Stapelverarbeitung geeignet. Amazon EBS bietet für anspruchsvolle E/A-Aufgaben wie relationale Datenbanken einen Direct Attached Storage auf Bausteinebene. Mit den relationalen Datenbanken des Dienstes Amazon RDS können Sie MySQL-Datenbanken problemlos verwalten. Amazon SimpleDB ist ein einfacher Dienst für nicht relationale Datenbanken, der häufig zum Speichern von Metadaten verwendet wird.
Neue Paradigmen wie MapReduce sind auf die Verarbeitung von großen Datensätzen zugeschnitten und werden von neuen Algorithmen der Bioinformatik genutzt. Amazon Elastic MapReduce bietet ein benutzerfreundliches, robustes Framework für die Bereitstellung von MapReduce-Anwendungen auf AWS, das auf dem Hadoop-Framework aufbaut.
Durch die Erstellung von Pipelines in der Cloud können Softwareentwickler und Forscher Amazon Machine Images (AMIs) problemlos speichern und gemeinsam nutzen. So können Anwendungen gegenseitig genutzt und für Analysen eine schnelle Ressourcenbereitstellung durchgeführt werden.
Pharmaforschung
Strukturbasierte Wirkstofferstellung, virtuelles Screening und andere Wirkstoffsimulationen sparen beträchtliche Mengen an Zeit und Ressourcen, da die Wirkstoffeffektivität vor Durchführung der teuren Prüfungen im Rahmen der Wirkstoffentwicklung eingeschätzt werden kann. Aufgrund der parallel stattfindenden virtuellen Screenings werden Geschwindigkeit und Qualität der Forschung häufig nur durch die Skalierbarkeit der Rechenleistung beeinträchtigt. Durch die Nutzung von Amazon EC2-Rechen-Instances können Forscher einige Dutzend, Hunderte oder gar Tausende Rechen-Instances ausführen, um schnell zu Ergebnissen zu gelangen.
Wissenschaftliche Zusammenarbeit und zentralisierte Datenverwaltung
Indem Datensätze immer größer wurden, ist das Verwalten und Weitergeben von Informationen zwischen weltweit agierenden Partnern zu einem äußerst schwierigen Unterfangen geworden. AWS bietet ein skalierbares, leicht zugängliches Daten-Repository, das der Rechenleistung für Experimente nahe kommt.
Darüber hinaus können aufgrund der elastischen Eigenschaften der Cloud mit rein verbrauchsabhängigen Kosten verteilte Wissenschaftlerteams ihre Arbeit schneller aufnehmen, ohne sich Sorgen darüber machen zu müssen, wie die Ressourcen bereitgestellt werden oder wo die Daten gespeichert werden sollen. Nach Abschluss eines Experiments können einige oder alle Ressourcen heruntergefahren werden, ohne dass weitere Kosten für die Ressourcen anfallen.
Die Daten können direkt aus Amazon S3 heraus verteilt werden. Wenn die Verzögerungszeit möglichst gering gehalten werden soll, erfolgt die Verteilung über das Netzwerk zur Inhaltsbereitstellung von Amazon CloudFront. Amazon Machine Images (AMIs) können in der Cloud gespeichert und gemeinsam genutzt werden, um den Ablauf von Experimenten zu erleichtern. Auch über EBS-Snapshots können Daten problemlos gemeinsam genutzt werden.
| Dienstleistungen |