La soluzione di elaborazione dei dati genomici di AstraZeneca esegue 51 miliardi di test in un giorno su AWS

2021

A circa 20 anni dalla pubblicazione del primo genoma umano, la genomica si sta trasformando da una pratica che pesa sulla ricerca a un motore per la medicina personalizzata. Impegnata in questa transizione, l'azienda biofarmaceutica globale AstraZeneca sta accelerando l'uso della genomica nella medicina di precisione e sta portando avanti la traduzione della genomica per trasformare la scoperta dei farmaci.

AstraZeneca utilizza petabyte di dati di sequenziamento genomico per informare la ricerca e lo sviluppo di farmaci. Per elaborare rapidamente i dati su larga scala, AstraZeneca ha utilizzato Amazon Web Services (AWS) per costruire una soluzione rapida ed efficiente per estrarre informazioni genomiche di grande impatto.

AstraZeneca Genomics su AWS: Un viaggio dai petabyte ai nuovi farmaci (1:19)
kr_quotemark

Grazie a queste capacità abbiamo fornito un contributo genetico a più di 40 progetti di scoperta di farmaci di AstraZeneca nel 2020".

Slavé Petrovski
VP, Head of Genome Analytics and Informatics, Centre for Genomics Research, R&D, AstraZeneca

Costruire una soluzione che liberi gli scienziati di innovare

Oltre a ricavare rapidamente informazioni dai dati genomici, AstraZeneca voleva riassegnare le risorse all'esplorazione scientifica ed evitare di dedicare il tempo della bioinformatica ad attività di gestione dei dati di valore relativamente basso. Poiché l'azienda raccoglie petabyte di dati da più fonti in grandi quantità, aveva bisogno di una capacità di calcolo potente e scalabile.

Avendo già costruito su AWS, AstraZeneca ha deciso di espandere l'uso degli strumenti AWS per sviluppare una soluzione bioinformatica basata sul cloud per l'elaborazione e l'analisi genomica rapida.

Automazione su AWS per produrre informazioni rapide

La soluzione a elevato throughput di AstraZeneca esegue molte fasi di elaborazione e analisi dei dati genomici. L'analisi genomica secondaria esamina le letture grezze del sequenziamento per ricostruire un genoma e identificare le varianti genomiche che possono essere analizzate ulteriormente in fasi successive. Per automatizzare l'orchestrazione dei dati in queste fasi, l'architettura utilizza AWS Lambda, un servizio di calcolo serverless che consente agli utenti di eseguire codice senza dover fornire o gestire server. Per creare un layer di esecuzione delle attività, l'architettura utilizza Batch AWS, che fornisce dinamicamente la quantità e il tipo ottimali di risorse di calcolo, come istanze ottimizzate per CPU o memoria, in base al volume e ai requisiti specifici di risorse dei lavori batch inviati. Lungo il percorso, l'architettura ordina i dati in bucket utilizzando Amazon Simple Storage Service (Amazon S3), un servizio di archiviazione di oggetti.

Con AWS, AstraZeneca ha accelerato e migliorato la produttività grazie alla scala, alla potenza di calcolo e all'accesso a ricchi servizi tecnologici. Poiché l'azienda può eseguire analisi su larga scala quando necessario, i dati sono disponibili per l'analisi prima. "Ora possiamo eseguire oltre 51 miliardi di test statistici in meno di 24 ore, studiando gli effetti di singole mutazioni o singoli geni, ciascuno con un'ampia gamma di fenotipi", afferma Slavé Petrovski, VP, responsabile del dipartimento di Genome Analytics and Informatics presso il Centre for Genomics Research di AstraZeneca. Gli sforzi dell'azienda stanno dando i loro frutti. "Abbiamo fornito input genetici a più di 40 progetti di scoperta di farmaci di AstraZeneca nel 2020 utilizzando queste capacità", afferma Petrovski.

Promuovere l'innovazione scientifica

AstraZeneca ha prodotto una pipeline bioinformatica genomica rapida ed efficiente che offre ai suoi scienziati il tempo e le risorse per perseguire l'innovazione. Di conseguenza, il Centre for Genomics Research dell'azienda sta facendo progressi nel suo obiettivo di analizzare due milioni di genomi entro il 2026.


Informazioni su AstraZeneca

AstraZeneca è un'azienda biofarmaceutica globale che sviluppa farmaci innovativi in diverse aree terapeutiche. Il Centre for Genomics Research è un'iniziativa di AstraZeneca che mira ad analizzare due milioni di genomi entro il 2026.

Vantaggi di AWS

  • Supporta l'esecuzione di oltre 51 miliardi di test statistici in meno di 24 ore.
  • Ha facilitato la fornitura di informazioni genomiche a più di 40 progetti di scoperta di farmaci nel 2020.
  • Aumenta o diminuisce per soddisfare le richieste irregolari di sequenziamento genomico
  • Libera risorse per l'esplorazione scientifica

Servizi AWS utilizzati

AWS Lambda

AWS Lambda è un servizio di calcolo serverless che ti permette di eseguire il codice senza effettuare il provisioning o gestire i server, creare una logica di dimensionamento dei cluster in funzione dei carichi di lavoro, mantenere integrazioni degli eventi o gestire i tempi di esecuzione.

Ulteriori informazioni »

AWS Batch

AWS Batch consente a sviluppatori, scienziati e ingegneri di eseguire in modo semplice ed efficiente centinaia di migliaia di lavori di elaborazione in batch su AWS.

Ulteriori informazioni »

Amazon S3

Amazon Simple Storage Service (Amazon S3) è un servizio di storage di oggetti che offre scalabilità, disponibilità dei dati, sicurezza e prestazioni all'avanguardia nel settore.

Ulteriori informazioni »


Nozioni di base

Le aziende di tutte le taglie e di tutti i settori stanno trasformando ogni giorno la propria attività grazie ad AWS. Contatta i nostri esperti e inizia subito il tuo viaggio in AWS Cloud