HGSC milik Baylor College of Medicine Menganalisis Data Genomika Lebih Cepat Menggunakan Illumina DRAGEN di AWS

2022

Human Genome Sequencing Center (HGSC) di Baylor College of Medicine (Baylor) adalah salah satu dari sedikit laboratorium pengurutan genomika yang menerima dana dari Program Penelitian All of Us dari National Institutes of Health di Amerika Serikat. Pada tahun 2019, HGSC mulai mengeksplorasi solusi untuk memberikan analisis yang sangat terukur dan aman dari set data genomikanya yang besar. HGSC melibatkan AWS Advanced Partner Illumina untuk menilai secara menyeluruh Platform Bio-IT Illumina DRAGEN (Dynamic Read Analysis for GENomics), solusi bioinformatika yang menyediakan analisis genomika sekunder data pengurutan yang sangat akurat, komprehensif, dan efisien serta menggunakan teknologi field programmable gate array (FPGA) untuk akselerasi. 

Menggunakan DRAGEN bersama layanan AWS, HGSC dapat menganalisis ratusan sampel genomika setiap hari. Solusi ini telah membantu Baylor meningkatkan partisipasinya dalam inisiatif penelitian, seperti Program Penelitian All of Us milik National Institutes of Health, upaya nasional untuk mempercepat kemajuan menuju pengobatan presisi dengan mengumpulkan dan menganalisis data kesehatan dan genetik dari satu juta sukarelawan.

Scientist Working on Computer In  Modern LaboratoryNOTE TO INSPECTOR: all graps, dna models, charts are made by me
kr_quotemark

Saat sejumlah besar data keluar dari instrumen pengurutan, kami menggunakan FPGA di AWS untuk memproses data tersebut dengan cepat.” 

Eric Venner
Lektor dan Kepala Kelompok Informatika Klinis (Associate Professor and Head of the Clinical Informatics Group), Human Genome Sequencing Center, Baylor College of Medicine

Mencari Solusi untuk Mempercepat Penelitian

Baylor adalah universitas ilmu kesehatan di Houston, Texas. Baylor menempati urutan kedua puluh di Amerika Serikat dalam pendanaan National Institutes of Health dan menempati urutan pertama dalam genetika. Pada tahun 2016, Baylor meluncurkan Laboratorium Klinik HGSC untuk mendukung upaya pengurutan berskala besar yang menyiapkan data genomika untuk penggunaan klinis. HGSC memainkan peran penting dalam Proyek Genom Manusia dan Program Penelitian All of Us, di mana Baylor, Johns Hopkins University, dan University of Texas Health Science Center di Houston bekerja sebagai pusat genom bersama kelompok lain di Amerika Serikat. 

Agar Baylor dapat berpartisipasi dalam program ini, HGSC perlu menskalakan untuk memenuhi beban kerja pengurutan yang besar dan menyederhanakan manajemen komputasi dan penyimpanan. Baylor juga harus memenuhi standar kepatuhan yang ketat, termasuk ISO/IEC 27001, yang terdiri dari lebih dari 100 persyaratan keamanan dan peraturan federal yang mengontrol aksesibilitas data dan informasi rahasia. Data genetik dianggap Informasi Terkontrol yang Tidak Terklasifikasi, yang tunduk pada kontrol pengamanan tambahan. “Kami harus memenuhi standar yang beberapa tingkat lebih tinggi daripada yang harus kami penuhi untuk HIPAA,” kata Richard Gibbs, direktur HGSC (director of the HGSC)

Baylor sebelumnya bekerja dengan Illumina, yang menyediakan teknologi pengurutan dan perangkat lunak, serta menggunakan AWS untuk komputasi genomika sejak 2012. Semua pusat penelitian yang berpartisipasi dalam Program Penelitian All of Us telah distandardisasi pada DRAGEN untuk analisis sekunder. Namun, HGSC menyadari bahwa migrasi ke DRAGEN di cloud dari on-premise memiliki potensi jangka panjang dan paling cepat, termasuk di bidang menarik dan mempertahankan anggota tim. “Bekerja di cloud memiliki keuntungan tersendiri karena orang-orang ingin mempelajari teknologi yang akan populer di beberapa dekade ke depan,” kata Eric Venner, lektor dan kepala kelompok informatika klinis (associate professor and head of the clinical informatics group) di HGSC. “Sekarang kita dapat menarik beberapa rekayasawan junior yang sangat berbakat.”

Menggunakan DRAGEN di AWS untuk Menemukan Akurasi, Skalabilitas, dan Keamanan

Pada musim semi tahun 2019, tim Baylor mulai berkolaborasi dengan Illumina pada teknologi panggilan varian, yang mengidentifikasi varian dalam data pengurutan. Pada musim gugur tahun 2019, Noora Siddiqui, rekayasawan tim, mulai membangun alur produksi menggunakan Illumina DRAGEN di AWS, AWS Quick Start yang menyiapkan lingkungan AWS yang dapat dikonfigurasi untuk DRAGEN. Setelah 3 minggu, pengujian skala pertama dilakukan, dan hanya lebih dari 3 bulan, alur sudah aktif dan berjalan. “Kami menyelesaikan alur menggunakan dukungan rekayasawan AWS,” kata Venner. “Dengan menggunakan Illumina DRAGEN di AWS, rekayasawan kami mampu membangun solusi ke dalam sistem produksi baru.”

 Dengan menggunakan DRAGEN Illumina di AWS, Baylor mampu menskalakan sesuai permintaan dan memproses data secara signifikan lebih cepat dari sebelumnya. HGSC memproses sekitar 5.000 genom setiap bulan. “Semua orang memiliki sequencer dan rencana, tetapi sulit untuk menghasilkan 5.000 genom yang andal dalam sebulan,” kata Gibbs. “Itulah yang kami lakukan di sini. Dibutuhkan banyak keterampilan teknik dan dukungan, tetapi industri dapat dilayani dengan baik.” 

Solusi DRAGEN dari Baylor mempercepat analisis data genomika menggunakan Instans F1 Amazon Elastic Compute Cloud (Amazon EC2); DRAGEN menggunakan FPGA untuk memberikan akselerasi perangkat keras khusus. “Beban kerja kami mengirimkan lonjakan singkat dan tiba-tiba,” kata Venner. “Saat sejumlah besar data keluar dari instrumen pengurutan, kami menggunakan FPGA di AWS untuk memproses data dengan cepat.” Pusat ini menggunakan Instans F1 Amazon EC2 bersama Instans Spot Amazon EC2, yang memungkinkan pengguna menjalankan beban kerja yang toleran terhadap kesalahan dengan diskon 90 persen dibandingkan Instans Sesuai Permintaan Amazon EC2. “Kami dapat menghemat biaya komputasi menggunakan Instans Spot,” kata Venner. 

HGSC menyimpan data langsungnya menggunakan Amazon Simple Storage Service (Amazon S3), layanan penyimpanan objek yang dibuat untuk mengambil sejumlah data dari mana pun. Data yang tidak langsung digunakan secara otomatis diteruskan ke Amazon S3 Glacier, yang menawarkan kelas penyimpanan cloud yang aman, tahan lama, dan sangat murah untuk pengarsipan data dan pencadangan jangka panjang. “Manajemen penyimpanan dan siklus hidup data otomatis di AWS sangat penting,” kata Venner. Tim teknologi informasi HGSC menggunakan AWS untuk membantu memenuhi standar keamanan dan kepatuhan. “Lebih mudah melakukan audit keamanan dalam solusi cloud baru daripada di lingkungan lama dengan banyak bagasi bawaan,” kata Venner.

HGSC dapat dengan cepat membangun lingkungan komputasi karena solusi DRAGEN-nya menggunakan Amazon Elastic Container Service (Amazon ECS), layanan orkestrasi kontainer terkelola penuh untuk melakukan deployment, mengelola, dan menskalakan aplikasi terkontainerisasi. “Menangkap lingkungan tempat tugas berjalan sangat berharga,” kata Venner. “Secara tradisional, orang akan membuat dan mengelola lingkungan yang kompleks untuk menjalankan berbagai jenis tugas di lokasi yang sama. Sekarang, kami hanya membuat lingkungan yang khusus untuk tugas yang sedang berjalan, yang menyederhanakan debugging.” 

Menerapkan Solusi Illumina dan AWS untuk Layanan Kesehatan

Dengan menggunakan DRAGEN Illumina di AWS, HGSC berharap dapat sepenuhnya mengintegrasikan teknologinya ke dalam praktik medis. Analisis HGSC terhadap genom manusia dapat memprediksi risiko kesehatan seseorang, menjelaskan kondisi yang mendasarinya, dan mengubah manajemen klinis, memfasilitasi perawatan yang lebih komprehensif untuk pasien. Misalnya, HGSC baru-baru ini berkolaborasi dengan klinik kardiovaskular di Texas Medical Center untuk melakukan studi HeartCare, yang berfokus pada identifikasi gen yang terkait dengan penyakit kardiovaskular. “Kami telah melihat alel kardiovaskular dengan penetrasi tinggi pada gen kunci dan bagaimana individu dapat memperoleh manfaat dari informasi itu di bawah model perawatan klinis,” kata Venner.

Di masa mendatang, Baylor akan terus mengeksplorasi layanan AWS dan solusi Illumina untuk lebih meningkatkan keamanan serta kecepatan pemrosesan datanya. “Kami berharap dapat meningkatkan aksesibilitas ke data genetik, terutama bagi mereka yang kurang terlayani dalam sistem perawatan medis atau yang mengalami banyak kesenjangan dalam perawatan,” kata Gibbs. “Mereka akan berada di garis depan. Kami ingin membantu mereka mengakses informasi genetik yang akan berguna dalam profil kesehatan mereka.”


Tentang Baylor College of Medicine

Baylor College of Medicine di Houston, Texas, adalah rumah bagi Human Genome Sequencing Center, salah satu dari sedikit pusat pengurutan genom di Amerika Serikat yang menerima dana dari National Institutes of Health.

Manfaat AWS

  • Membangun alur datanya hanya dalam waktu 3 bulan
  • Memproses data lebih cepat dibandingkan dengan alur sebelumnya
  • Memproses sekitar 5.000 genom per bulan
  • Merekrut talenta rekayasa teratas
  • Menyederhanakan keamanan dan kepatuhan
  • Mengotomatiskan manajemen penyimpanan dan proses siklus hidup data
  • Menskalakan secara otomatis untuk memenuhi lonjakan volume

Layanan AWS yang Digunakan

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) adalah layanan web yang memberikan kapasitas komputasi yang aman dan berukuran fleksibel di cloud. Amazon EC2 dirancang untuk membuat komputasi cloud berskala web lebih mudah bagi pengembang.

Pelajari selengkapnya »

Instans F1 Amazon EC2

Instans F1 Amazon EC2 menggunakan FPGA untuk memungkinkan pengiriman akselerasi perangkat keras kustom. Instans F1 mudah diprogram dan disertakan dengan berbagai hal yang Anda butuhkan untuk membangun, menyimulasikan, melakukan debug, dan mengompilasi kode akselerasi perangkat keras Anda, termasuk AMI Developer FPGA serta mendukung pengembangan tingkat perangkat keras di cloud.

Pelajari selengkapnya »

Instans Spot Amazon EC2

Instans Spot Amazon EC2 memungkinkan Anda memanfaatkan kapasitas EC2 yang tidak terpakai di AWS cloud. Instans Spot tersedia dengan diskon hingga 90% dibandingkan dengan harga Sesuai Permintaan.

Pelajari selengkapnya »

Illumina DRAGEN di AWS

Platform Bio-IT DRAGEN memungkinkan analisis ultracepat dari data pengurutan generasi berikutnya (NGS), secara signifikan mengurangi waktu yang dibutuhkan untuk menganalisis data genomika, dan meningkatkan akurasi.

Pelajari selengkapnya »


Memulai

Organisasi dari semua ukuran di semua industri mengubah bisnis mereka dan mewujudkan misi mereka setiap hari menggunakan AWS. Kontak ahli kami dan mulai perjalanan AWS Anda sendiri sekarang juga.