Kisah Pelanggan/Ilmu Hayat
2023
BioNTech Mempercepat Pemrosesan Data untuk Alur Kerja Proteomika sebesar 500x Menggunakan AWS
Pelajari bagaimana BioNTech mempercepat pemrosesan data spektrometri massa menggunakan alur kerja paralel untuk mengurangi waktu pemrosesan hingga 500 kali lipat.
50%–75%
pengurangan waktu pencarian file
Mengurangi secara signifikan
biaya instans komputasi
Menjalankan ratusan
pencarian data secara bersamaan
Produktivitas
ilmuwan yang lebih baik sambil mempertahankan keamanan data yang kuat
Aksesibilitas
dan penggunaan kembali data meningkat dalam organisasi
Gambaran Umum
Berkantor pusat di Jerman, BioNTech adalah perusahaan global yang mengkhususkan diri dalam mengembangkan imunoterapi dan vaksin, seperti vaksin Pfizer-BioNTech COVID-19, untuk kanker dan penyakit menular. Spektrometri massa (MS) adalah teknologi yang andal untuk identifikasi langsung peptida yang terikat pada molekul antigen leukosit manusia (HLA) dari jaringan tumor atau galur sel yang diambil pasien. Imunopeptidoma HLA ini dapat diinterogasi sebagai sumber penemuan antigen untuk terapi berbasis sel dan digunakan untuk melatih model machine learning dalam menginformasikan pengembangan vaksin.
BioNTech bertujuan untuk lebih meningkatkan alur kerjanya untuk menyimpan, mengatur, dan memproses data MS dalam jumlah terabita untuk membuatnya lebih efisien dan dapat diskalakan. Perusahaan memutuskan untuk memigrasikan perangkat lunak MS on-premise dan penyimpanan datanya ke Amazon Web Services (AWS), sehingga penanganan canggih dapat diskalakan dan aman. Sekarang, BioNTech telah mempercepat waktunya untuk mendapatkan wawasan dan mempermudah peneliti berbagi dan berkolaborasi pada data MS menggunakan Gateway AWS Storage, layanan yang menyediakan aplikasi on-premise dengan akses ke penyimpanan cloud yang hampir tidak terbatas.
Peluang | Menggunakan Gateway AWS Storage untuk Lebih Merampingkan dan Mempercepat Pemrosesan Data Spektrometri Massa BioNTech
Spektrometri massa adalah metodologi yang andal untuk imunopeptidomik karena dapat mendeteksi dan mengidentifikasi ribuan peptida terikat HLA yang unik dalam satu analisis jaringan dan galur sel yang relevan secara klinis. Set data mentah yang dihasilkan dalam satu akuisisi adalah kumpulan besar spektrum yang dapat dicari berdasarkan basis data proteom referensi untuk menghasilkan identifikasi peptida dan protein. Dalam alur kerja proteomika dan imunopeptidomik, paket perangkat lunak seperti Spectrum Mill MS Proteomics Software adalah komponen penting dalam memproses dan menganalisis volume besar data MS yang dikumpulkan secara rutin.
Hingga 2022, perusahaan menjalankan perangkat lunak ini di server lokal. Para ilmuwan harus memindahkan data secara manual dari komputer instrumen ke stasiun kerja lokal yang menjalankan Spectrum Mill, dan perangkat ini akan terisi dengan cepat, sehingga membutuhkan langkah-langkah tambahan untuk mengarsipkan data. “Total data kami dapat dipastikan mencapai 10-15 terabita, dan pemindahannya ke perangkat on-premise memakan waktu dan menantang,” kata Akhil Chaudhary, insinyur data di BioNTech. “Ketika kegiatan penelitian kami berkembang, pengumpulan data MS kami juga meningkat secara signifikan,” kata Michael McCarthy, arsitek solusi di BioNTech. “Perangkat keras lokal tidak bisa lagi mendukung skala kami.”
Untuk mempercepat pemrosesan data dan akses ke hasil yang ditafsirkan, tim biologi komputasi BioNTech membutuhkan cara untuk memproses ratusan permintaan secara bersamaan dengan parameter pencarian dan basis data urutan protein yang berbeda sebagai bagian dari upaya mereka untuk memaksimalkan informasi peptida dan protein untuk penemuan baru. Departemen mendekati tim BioNData—grup data dan analitik pusat di dalam perusahaan—agar membangun alat untuk menskalakan kemampuan pemrosesan data secara horizontal. Tim memilih AWS untuk membangun model data lab hibrida dan membuat API penskalaan horizontal. “Di AS, kami memiliki sejarah panjang dalam menggunakan AWS dengan sukses di dalam produk,” kata McCarthy. “Pilihan tersebut sudah sewajarnya.”
Di AWS, para ilmuwan kami menghasilkan dan berbagi data dalam jumlah yang jauh lebih besar dengan tujuan menemukan terapi yang efektif, bertarget, dan terapi dipersonalisasi untuk pasien. Hanya imajinasilah yang membatasi Anda, dan saya belum menemukan sesuatu yang tidak dapat saya bangun di AWS.“
Michael McCarthy
Arsitek Solusi, BioNTech
Solusi | Mempercepat Pemrosesan Data Secara Besar-besaran Menggunakan Alur Kerja Paralel
Pada fase pertama, fokus BioNTech adalah untuk dapat memindahkan data dengan mulus dari komputer instrumen MS ke cloud dan melakukan hosting pada Spectrum Mill di AWS. Fase kedua melibatkan pembangunan sistem untuk menjalankan permintaan pencarian secara bersamaan.
Untuk memindahkan data mentah MS ke cloud, BioNTech menginstal agen Gateway AWS Storage di setiap komputer instrumen. Setelah akuisisi, data mentah MS dengan cepat dan otomatis dipindahkan ke Amazon Simple Storage Service (Amazon S3), layanan penyimpanan objek yang dibangun untuk mengambil data dalam jumlah berapa pun dari mana saja. “Kecepatannya sungguh luar biasa. File berukuran 5 GB hanya membutuhkan waktu 5-10 detik untuk muncul di Amazon S3,” kata Chaudhary. Dengan beberapa instrumen yang menghasilkan set data besar, saluran data MS ini memungkinkan migrasi data yang lebih efisien ke lokalisasi terpusat agar mudah diakses untuk pemrosesan dan pengarsipan.
Tim biologi komputasi BioNTech dengan cepat mengadopsi alur kerja baru. “Semua orang menggunakan sistem berbasis cloud, dan para peneliti menganggapnya jauh lebih sederhana,” kata McCarthy. “Kami mengotomatiskan manajemen data di AWS, sehingga para ilmuwan dapat fokus pada sains.”
Selanjutnya, tim memasang Spectrum Mill di Amazon Elastic Compute Cloud (Amazon EC2), yang menyediakan kapasitas komputasi yang aman dan dapat diubah ukurannya untuk hampir semua beban kerja. “Dengan menjalankan Spectrum Mill di cloud, kami mengurangi waktu masing-masing pencarian sebesar 50—75 persen,” kata Chaudhary. Selain itu, BioNTech menjalankan Instans Spot Amazon EC2, yang dapat menjalankan beban kerja toleran kesalahan dengan diskon hingga 90 persen dibandingkan dengan harga sesuai Permintaan. Karena perusahaan hanya membayar untuk waktu menggunakan instans, hal ini telah mengurangi biaya komputasi secara signifikan.
Untuk menskalakan jumlah alur kerja yang dapat dijalankan pada satu waktu, tim menggunakan Amazon Machine Images, yang menyediakan informasi yang diperlukan untuk meluncurkan sebuah instans, dan Amazon EC2 Auto Scaling, yang dapat menambah atau menghapus kapasitas komputasi untuk memenuhi permintaan yang berubah. “Sekarang, kami menjalankan pencarian 50-75 persen lebih cepat, dan dengan Amazon EC2 Auto Scaling, kami dapat menjalankan ratusan instans secara paralel, sehingga mempercepat pemrosesan data secara besar-besaran hingga 500 kali,” kata McCarthy.
BioNTech mengelola alur kerja Spectrum Mill menggunakan Amazon Simple Queue Service(Amazon SQS), layanan antrean pesan yang dikelola sepenuhnya. Selain itu, perusahaan menggunakan Amazon API Gateway, layanan untuk membuat, memelihara, dan mengamankan API dalam skala apa pun, untuk menjalankan pencarian Spectrum Mill. Kemudian, mereka menarik data dari gudang data di Amazon Redshift, yang menawarkan kinerja harga yang sangat baik untuk pergudangan data cloud. Set data ini digunakan oleh tim ilmiah untuk mengidentifikasi target terapeutik dan membangun algoritma kecerdasan buatan untuk desain vaksin.
Tim menghubungkan hasil yang diproses dengan konsumen data di seluruh perusahaan dengan data.all, alat sumber terbuka untuk berbagi set data di seluruh akun AWS. Hasilnya, peneliti tidak perlu lagi menghabiskan waktu untuk manajemen data. “Di AWS, para ilmuwan kami menghasilkan dan berbagi data dalam jumlah yang jauh lebih besar dengan tujuan menemukan terapi yang efektif, bertarget, dan dipersonalisasi untuk pasien,” kata McCarthy.
Hasil | Memperluas Kecepatan dan Skalabilitas ke Lebih Banyak Alur Kerja
BioNTech dengan cepat melihat manfaat alur kerja barunya di AWS. “Kami bisa mengulang semua pekerjaan dari 7 tahun terakhir dalam 60 jam dengan harga yang lebih murah,” kata Chaudhary. Pada fase berikutnya, tim ingin meningkatkan dan mengotomatiskan alat analisis spektrometri massa untuk menurunkan tingkat penemuan peptida yang salah. Tim ini juga membuat pembungkus grafis di sekitar API-nya sehingga semua tim di BioNTech dapat memanfaatkan API dalam alur kerja sehari-hari mereka.
“Proyek Spectrum Mill hanyalah yang pertama dari banyaknya proyek yang kami rencanakan,” kata McCarthy. “Proyek ini membuat kami yakin bahwa kami dapat memecahkan masalah serupa untuk tim global kami. Hanya imajinasilah yang membatasi Anda, dan saya belum menemukan sesuatu yang tidak dapat saya bangun di AWS.”
Tentang BioNTech
BioNTech adalah perusahaan penelitian dan pengembangan imunoterapi global yang menciptakan dan memproduksi imunoterapi aktif dan melakukan uji klinis pengobatan dan vaksin untuk kanker dan penyakit lainnya.
Layanan AWS yang Digunakan
AWS Storage Gateway
Gateway AWS Storage adalah serangkaian layanan penyimpanan cloud hibrida yang menyediakan akses on-premise ke penyimpanan cloud yang hampir tidak terbatas.
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) menawarkan platform komputasi terluas dan terdalam, dengan lebih dari 750 instans dan pilihan prosesor, penyimpanan, jaringan, sistem operasi, serta model pembelian terbaru untuk membantu Anda menyesuaikan dengan kebutuhan beban kerja.
Pelajari lebih lanjut »
Amazon S3
Amazon Simple Storage Service (Amazon S3) adalah layanan penyimpanan objek yang menawarkan skalabilitas, ketersediaan data, keamanan, dan performa terdepan di industri.
Pelajari lebih lanjut »
Amazon SQS
Amazon Simple Queue Service (Amazon SQS) memungkinkan Anda untuk mengirim, menyimpan, dan menerima pesan antarkomponen perangkat lunak berapa pun volumenya, tanpa kehilangan pesan atau memerlukan layanan lain agar dapat tersedia.
Pelajari lebih lanjut »
Kisah Pelanggan Ilmu Hayat Lainnya
Mulai
Organisasi dalam berbagai ukuran di semua industri mentransformasi bisnis mereka dan mewujudkan misi mereka setiap hari menggunakan AWS. Hubungi ahli kami dan mulai perjalanan AWS Anda sendiri sekarang juga.