Referenzbereitstellung

Illumina DRAGEN in AWS

Analyse von Sequenzierungsdaten der nächsten Generation

Diese Partnerlösung setzt die Illumina DRAGEN (Dynamic Read Analysis for GENomics) Bio-IT-Plattform in der Amazon-Web-Services-Cloud (AWS) ein.

Die DRAGEN Bio-IT-Plattform ermöglicht die ultraschnelle Analyse von Next-Generation-Sequencing-Daten (NGS), reduziert die zur Analyse von Genomdaten erforderliche Zeit beträchtlich und verbessert die Genauigkeit. Es umfasst Bioinformatik-Pipelines, die optimierte Algorithmen zur Kartierung, Ausrichtung, Sortierung, Duplikatmarkierung und Haplotypvariant-Calling bereitstellen. Diese Pipelines umfassen Germline, Somatik (Tumor und Tumor/normal), RNS, Einzellzell-RNS, Methylierung, gemeinsame Genotypisierung und DRAGEN-GATK.

Die Partnerlösung erstellt eine AWS-Umgebung über zwei Availability Zones für Hochverfügbarkeit und stellt zwei AWS-Batch-Rechenumgebungen für Spot-Instances und On-Demand-Instances bereit. Diese Umgebungen enthalten DRAGEN F1-Instances, die zur Hardwarebeschleunigung mit feldprogrammierbaren Gate-Arrays (FPGAs) verbunden sind.

Illumina-Logo

Diese Partnerlösung wurde von Ilumina in Zusammenarbeit mit AWS entwickelt. Illumina ist ein AWS-Partner.


AWS-Service-Catalog-Administratoren können diese Architektur zu ihrem eigenen Katalog hinzufügen.  

  •  Ihre Möglichkeiten
  • Nutzen Sie diese Partnerlösung, um die folgende konfigurierbare Umgebung in AWS einzurichten:

    • Eine hochverfügbare Architektur, die sich über zwei Availability Zones erstreckt.*
    • Eine gemäß den bewährten Methoden von AWS mit öffentlichen und privaten Subnetzen konfigurierte Virtual Private Cloud (VPC). Dies stellt die Netzwerkinfrastruktur für Ihre Bereitstellung bereit.*
    • Ein Internet-Gateway für den Zugang zum Internet.*
    • In den öffentlichen Subnetzen ermöglichen verwaltete NAT-Gateways den ausgehenden Internetzugriff auf Ressourcen in den privaten Subnetzen.*
    • Eine AWS CodePipeline, die ein Docker-Image erstellt und dieses dann in ein Amazon Elastic Container Registry (Amazon ECR) Repository hochlädt.
    • Zwei AWS Batch Compute-Umgebungen: Eine für Amazon Elastic Compute Cloud (Amazon EC2) Spot Instances und die andere für On-Demand Instances.
    • Eine AWS Batch-Job-Warteschlange, die Einreichungen für die Rechenumgebung für Spot Instances priorisiert, was die Kosten optimiert.
    • Eine AWS Batch-Job-Definition für das Ausführen von DRAGEN.
    • AWS-Identity-and-Access-Management-Rollen (IAM) und -Richtlinien für die Ausführung des AWS-Batch-Auftrags.

    * Die Vorlage, die Partnerlösung in einer bestehenden VPC einrichtet, überspringt die mit Sternchen markierten Aufgaben und fordert Sie zur Eingabe Ihrer vorhandenen VPC-Konfiguration auf.

  •  Bereitstellungsanleitung
  • Zur Bereitstellung von Illumina DRAGEN befolgen Sie bitte die Anweisungen im Bereitstellungsleitfaden. Der Einrichtungsprozess umfasst folgende Schritte:

    1. Falls Sie noch kein AWS-Konto haben, registrieren Sie sich bitte unter https://aws.amazon.com.
    2. Abonnieren Sie die DRAGEN Bio-IT-Plaftform in AWS Marketplace.
    3. Starten Sie die Partnerlösung. Jede Bereitstellung dauert etwa 15 Minuten. Sie können zwischen zwei Optionen wählen:
    4. Testen Sie die Bereitstellung, indem Sie einen DRAGEN-Job ausführen.

    Um Ihre Bereitstellung zu optimieren, konfigurieren Sie die Netzwerkarchitektur, legen Sie die gewünschte Anzahl an virtuellen CPUs für die AWS Batch-Umgebung fest, bestimmen Sie einen Gebotsprozentsatz für Spot Instances und geben Sie die Anzahl der AWS-Batch-Auftrag-Neuversuche an.

    Amazon kann Informationen zur Benutzerbereitstellung an den AWS-Partner weitergeben, der mit AWS an dieser Lösung zusammengearbeitet hat.  

  •  Kosten und Lizenzen
  • Diese Partnerlösung erfordert ein Abonnement des Amazon Machine Image (AMI) für die DRAGEN-Bio-IT-Plattform, das auf dem AWS Marketplace mit einem Preis pro Stunde erhältlich ist.

    Sie tragen die Kosten für die AWS-Services und alle Lizenzen von Drittanbietern, die bei der Nutzung dieser Lösung verwendet werden. Für die Nutzung der Lösung fallen keine zusätzlichen Kosten an.

    Diese Lösung umfasst Konfigurationsparameter, die Sie anpassen können. Einige dieser Einstellungen, beispielsweise der Instance-Typ, wirken sich auf die Bereitstellungskosten aus. Kostenvoranschläge finden Sie auf den Preisseiten der einzelnen AWS-Services, die Sie nutzen. Preisänderungen sind vorbehalten.

    Tipp: Erstellen Sie nach dem Bereitstellen einer Lösung AWS-Kosten- und -Nutzungsberichte, um die damit verbundenen Kosten zu verfolgen. Diese Berichte liefern Abrechnungsmetriken an einen Amazon Simple Storage Service (Amazon S3)-Bucket in Ihrem Konto. Sie liefern Kostenschätzungen auf der Grundlage der Nutzung während jedes Monats und aggregieren die Daten am Ende des Monats. Weitere Informationen finden Sie unter  Was sind AWS-Kosten- und Nutzungsberichte?