Kisah Pelanggan/Ilmu Hayati

2023
Logo BioNtech

BioNTech Mempercepat Pemrosesan Data untuk Alur Kerja Proteomik hingga 500 Kali Lebih Cepat dengan Menggunakan AWS

Pelajari cara BioNTech mempercepat pemrosesan data spektrometri massa dengan menggunakan alur kerja paralel untuk mengurangi waktu pemrosesan hingga 500 kali lebih cepat.

50%–75%

pengurangan waktu pencarian file

Secara signifikan mengurangi

biaya instans komputasi

Menjalankan ratusan

pencarian data secara simultan

Meningkatkan

produktivitas para ilmuwan sekaligus tetap menjaga keamanan data yang kuat

Meningkatkan

aksesibilitas dan ketergunaan ulang data di dalam organisasi

Gambaran Umum

Berkantor pusat di Jerman, BioNTech adalah perusahaan global yang mengkhususkan diri dalam pengembangan imunoterapi dan vaksin, seperti vaksin COVID-19 Pfizer-BioNTech, untuk penyakit kanker dan infeksi. Spektrometri massa (MS) adalah teknologi yang andal untuk mengidentifikasi secara langsung peptida yang terikat pada molekul antigen leukosit manusia (HLA) dari jaringan tumor yang berasal dari pasien atau lini sel. Imunopeptidom HLA ini dapat dianalisis sebagai sumber penemuan antigen untuk terapi berbasis sel dan digunakan untuk melatih model machine learning guna mendukung pengembangan vaksin. 

BioNTech bertujuan untuk semakin meningkatkan alur kerjanya dalam menyimpan, mengatur, dan memproses data MS dalam jumlah terabita agar lebih efisien dan mudah diskalakan. BioNTech memutuskan untuk memigrasi perangkat lunak MS dan penyimpanan datanya yang sebelumnya on-premise ke Amazon Web Services (AWS), sehingga memungkinkan penanganan yang mutakhir, dapat diskalakan, dan aman. Kini, BioNTech telah mempercepat waktu untuk memperoleh wawasan dan mempermudah para peneliti dalam berbagi serta berkolaborasi pada data MS dengan menggunakan Gateway AWS Storage, sebuah layanan yang memberikan akses penyimpanan cloud yang nyaris tak terbatas bagi aplikasi yang berjalan di lingkungan on-premise.

Young female tech or scientist performs protein assay

Peluang | Menggunakan Gateway AWS Storage untuk Lebih Menyederhanakan dan Mempercepat Pemrosesan Data Spektrometri Massa BioNTech

Spektrometri massa merupakan metodologi yang kuat untuk imunopeptidomik karena mampu mendeteksi dan mengidentifikasi ribuan peptida unik yang terikat pada HLA dalam satu kali analisis terhadap jaringan dan lini sel yang relevan secara klinis. Set data mentah yang dihasilkan dari satu kali akuisisi merupakan kumpulan spektra berukuran besar yang dapat dicocokkan dengan basis data proteom referensi untuk menghasilkan identifikasi peptida dan protein. Dalam alur kerja proteomik dan imunopeptidomik, paket perangkat lunak seperti Spectrum Mill MS Proteomics Software merupakan komponen penting dalam memproses dan menganalisis volume besar data MS yang dikumpulkan secara rutin. 

Hingga tahun 2022, perusahaan menjalankan perangkat lunak ini di server lokal. Para ilmuwan harus memindahkan data secara manual dari komputer instrumen ke stasiun kerja lokal yang menjalankan Spectrum Mill, dan perangkat ini cepat penuh, sehingga memerlukan langkah tambahan untuk mengarsipkan data. “Total data kami dengan mudah mencapai 10–15 terabita, dan memindahkannya ke perangkat on-premise sangat memakan waktu dan menantang”, ujar Akhil Chaudhary, insinyur data di BioNTech. “Seiring dengan berkembangnya aktivitas riset kami, pengumpulan data MS kami juga meningkat secara signifikan”, ujar Michael McCarthy, arsitek solusi di BioNTech. “Perangkat keras lokal tidak lagi mampu mendukung skala kami.” 

Untuk mempercepat pemrosesan data dan akses terhadap hasil interpretasi, tim biologi komputasional BioNTech memerlukan cara untuk memproses ratusan permintaan secara simultan dengan parameter pencarian dan basis data urutan protein yang berbeda, sebagai bagian dari upaya mereka memaksimalkan informasi peptida dan protein guna menemukan temuan baru. Departemen tersebut mendekati tim BioNData—sebuah grup pusat data dan analitik di dalam perusahaan—untuk membangun alat yang dapat meningkatkan kemampuan pemrosesan data secara horizontal. Tim tersebut memilih AWS untuk membangun model data laboratorium hibrida dan menciptakan API yang dapat diskalakan secara horizontal. “Di AS, kami memiliki sejarah panjang dalam menggunakan AWS dengan sukses dalam produk-produk kami”, ujar McCarthy. “Pilihan tersebut sudah sewajarnya.”

kr_quotemark

Di AWS, para ilmuwan kami menghasilkan dan berbagi data dalam jumlah yang jauh lebih besar dengan tujuan menemukan terapi yang efektif, terarah, dan personal bagi para pasien. Hanya imajinasilah yang membatasi Anda, dan sejauh ini saya belum menemukan sesuatu yang tidak dapat saya bangun di AWS."

Michael McCarthy
Solutions Architect, BioNTech

Solusi | Mempercepat Pemrosesan Data Secara Masif dengan Menggunakan Alur Kerja Paralel

Pada fase pertama, fokus BioNTech adalah memastikan data dapat dipindahkan secara lancar dari komputer instrumen MS ke cloud dan menjalankan Spectrum Mill di AWS. Fase kedua melibatkan pembangunan sistem untuk menjalankan permintaan pencarian secara simultan. 

Untuk memindahkan data mentah MS ke cloud, BioNTech menginstal agen Gateway AWS Storage pada setiap komputer instrumen. Setelah akuisisi, data mentah MS dipindahkan dengan cepat dan otomatis ke Amazon Simple Storage Service (Amazon S3), layanan penyimpanan objek yang dirancang untuk mengambil data dalam jumlah berapa pun dari mana saja. “Kecepatannya sungguh luar biasa. File berukuran 5 GB hanya memerlukan waktu 5–10 detik untuk muncul di Amazon S3”, ujar Chaudhary. Dengan banyaknya instrumen yang menghasilkan set data berukuran besar, jalur data MS ini memungkinkan migrasi data yang lebih efisien ke lokasi terpusat, sehingga memudahkan akses untuk pemrosesan dan pengarsipan. 

Tim biologi komputasional BioNTech dengan cepat mengadopsi alur kerja baru ini. “Semua orang menggunakan sistem berbasis cloud, dan para peneliti merasa itu jauh lebih sederhana”, ujar McCarthy. “Kami mengotomatiskan manajemen data di AWS, sehingga para ilmuwan dapat fokus pada sainsnya.” 

Selanjutnya, tim memasang Spectrum Mill di Amazon Elastic Compute Cloud (Amazon EC2), yang menyediakan kapasitas komputasi yang aman dan dapat disesuaikan untuk hampir semua jenis beban kerja. “Dengan menjalankan Spectrum Mill di cloud, kami mengurangi waktu masing-masing pencarian sebesar 50–75 persen”, ujar Chaudhary. Selain itu, BioNTech menjalankan Instans Spot Amazon EC2, yang dapat digunakan untuk beban kerja toleran terhadap gangguan dengan biaya hingga 90 persen lebih rendah dibandingkan harga Sesuai Permintaan. Karena perusahaan hanya membayar sesuai dengan waktu penggunaan instans, biaya komputasi pun berkurang secara signifikan. 

Untuk menskalakan jumlah alur kerja yang dapat dijalankan secara bersamaan, tim menggunakan Amazon Machine Images, yang menyediakan informasi yang diperlukan untuk meluncurkan sebuah instans, dan Amazon EC2 Auto Scaling, yang dapat menambah atau mengurangi kapasitas komputasi sesuai dengan perubahan kebutuhan. “Sekarang, kami menjalankan pencarian 50–75 persen lebih cepat, dan dengan Amazon EC2 Auto Scaling, kami dapat menjalankan ratusan instans secara paralel, mempercepat pemrosesan data hingga 500 kali lipat”, ujar McCarthy. 

BioNTech mengelola alur kerja Spectrum Mill menggunakan Amazon Simple Queue Service (Amazon SQS), layanan antrean pesan yang dikelola sepenuhnya. Selain itu, perusahaan menggunakan Amazon API Gateway, layanan untuk membuat, memelihara, dan mengamankan API dalam skala apa pun, untuk menjalankan pencarian Spectrum Mill. Kemudian, data diambil dari gudang data di Amazon Redshift, yang menawarkan performa harga yang sangat baik untuk penyimpanan data di cloud. Set data ini digunakan oleh tim ilmiah untuk mengidentifikasi target terapeutik dan membangun algoritma kecerdasan buatan guna perancangan vaksin. 

Tim menghubungkan hasil yang telah diproses dengan pengguna data di seluruh perusahaan menggunakan data.all, alat sumber terbuka untuk berbagi set data antar akun AWS. Hasilnya, para peneliti tidak lagi perlu menghabiskan waktu untuk mengelola data. “Di AWS, para ilmuwan kami menghasilkan dan berbagi data dalam jumlah yang meningkat secara eksponensial dengan tujuan menemukan terapi yang efektif, terarah, dan personal bagi para pasien”, ujar McCarthy.

Hasil | Memperluas Kecepatan dan Skalabilitas ke Lebih Banyak Alur Kerja

BioNTech dengan cepat merasakan manfaat dari alur kerja barunya di AWS. “Kami dapat mengulang seluruh pekerjaan dari 7 tahun terakhir hanya dalam 60 jam dengan biaya yang jauh lebih rendah”, ujar Chaudhary. Pada fase berikutnya, tim berencana untuk meningkatkan dan mengotomatiskan alat analisis spektrometri massa guna menurunkan tingkat temuan palsu pada peptida. Tim juga sedang membuat antarmuka grafis di sekitar API-nya agar semua tim di BioNTech dapat memanfaatkan API tersebut dalam alur kerja harian mereka.

“Proyek Spectrum Mill ini hanyalah yang pertama dari banyak proyek yang sedang kami rencanakan”, ujar McCarthy. “Proyek ini membuat kami yakin bahwa kami dapat menyelesaikan masalah serupa untuk tim global kami. Hanya imajinasilah yang membatasi Anda, dan sejauh ini saya belum menemukan sesuatu yang tidak dapat saya bangun di AWS.”

Tentang BioNTech

BioNTech adalah perusahaan global yang bergerak di bidang penelitian dan pengembangan imunoterapi, yang menciptakan dan memproduksi imunoterapi aktif serta melakukan uji klinis untuk pengobatan dan vaksin bagi kanker dan penyakit lainnya.

Layanan AWS yang Digunakan

Gateway AWS Storage

Gateway AWS Storage adalah rangkaian layanan penyimpanan cloud hibrida yang menyediakan akses on-premise ke penyimpanan cloud yang hampir tidak terbatas.

Pelajari selengkapnya »

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) menawarkan platform komputasi terluas dan terdalam, dengan lebih dari 750 instans dan pilihan prosesor, penyimpanan, jaringan, sistem operasi, serta model pembelian terbaru untuk membantu Anda menyesuaikan dengan kebutuhan beban kerja. 

Pelajari selengkapnya »

Amazon S3

Amazon Simple Storage Service (Amazon S3) adalah layanan penyimpanan objek yang menawarkan skalabilitas, ketersediaan data, keamanan, dan performa terdepan di industri. 

Pelajari selengkapnya »

Amazon SQS

Amazon Simple Queue Service (Amazon SQS) memungkinkan Anda untuk mengirim, menyimpan, dan menerima pesan antarkomponen perangkat lunak berapa pun volumenya, tanpa kehilangan pesan atau memerlukan layanan lain agar dapat tersedia.

Pelajari selengkapnya »

Kisah Pelanggan Ilmu Hayat Lainnya

tidak ada item yang ditemukan 

1

Mulai

Organisasi dalam berbagai ukuran di semua industri mentransformasi bisnis mereka dan mewujudkan misi mereka setiap hari menggunakan AWS. Hubungi ahli kami dan mulai perjalanan AWS Anda sendiri sekarang juga.