FAQ Amazon HealthOmics

Umum

AWS HealthOmics adalah layanan yang dibuat khusus yang membantu organisasi layanan kesehatan dan ilmu hayati serta partner perangkat lunak untuk menyimpan, membuat kueri, dan menganalisis data genomika, transkriptomik, serta omik lainnya, kemudian menghasilkan wawasan dari data tersebut untuk meningkatkan kesehatan. Layanan ini mendukung analisis dan penelitian kolaboratif skala besar.

AWS HealthOmics menyediakan alur kerja yang dapat diskalakan dan alat terintegrasi untuk menyiapkan serta menganalisis data omik, dan secara otomatis menyediakan serta menskalakan infrastruktur yang mendasarinya agar Anda dapat menghabiskan lebih banyak waktu untuk penelitian dan inovasi. AWS HealthOmics mendukung analisis dan penelitian kolaboratif skala besar.

AWS HealthOmics dapat memproses data secara langsung dari Amazon Simple Storage Service (S3) atau penyimpanan AWS HealthOmics menggunakan alur kerja AWS HealthOmics privat dan Ready2Run. Anda dapat mengimpor data seperti file sekuens genomika mentah, file format panggilan varian, dan set data anotasi dari Amazon S3 ke dalam penyimpanan serta penyimpanan analitik AWS HealthOmics yang kompatibel untuk bioinformatika. Anda dapat mengontrol akses ke penyimpanan varian dan anotasi AWS HealthOmics menggunakan AWS Lake Formation serta menggunakan Amazon Athena untuk memudahkan pembuatan kueri dan penggabungan data dengan bentuk data lainnya, seperti rekam kesehatan medis dari Amazon HealthLake. Anda juga dapat menggunakan Amazon Athena untuk memudahkan pembuatan kueri dan penggabungan data dengan bentuk data lainnya, seperti rekam kesehatan medis dari Amazon HealthLake. Selain itu, Anda dapat menggunakan data yang ditransformasikan di Amazon QuickSight untuk analitik lanjutan. Anda juga dapat menggunakan Amazon SageMaker untuk membangun, melatih, dan melakukan deployment algoritma machine learning baru di data multiomik dan multimodal Anda. Terakhir, Anda juga dapat menggunakan Amazon EventBridge untuk memublikasikan peristiwa sebagai bagian dari arsitektur yang didorong peristiwa.

Kami memiliki dua tipe penyimpanan data, satu tipe untuk data biologis mentah dan satu tipe untuk data varian serta anotasi. Penyimpanan AWS HealthOmics dapat mengimpor genom referensi berformat FASTA dan file sekuens mentah berformat FASTQ, BAM, serta CRAM yang dibuat gzip. Penyimpanan analitik AWS HealthOmics dapat mengimpor file berformat (g)VCF untuk data varian dan file VCF, GFF, serta TSV/CSV untuk anotasi genomika. Alur kerja AWS HealthOmics dapat membaca data apa pun yang didukung oleh definisi alur kerja yang ditentukan dan alat dari penyimpanan AWS HealthOmics atau Amazon S3.

Alur kerja AWS HealthOmics mendukung definisi alur kerja yang sesuai dengan spesifikasi WDL 1.1 atau Nextflow 22.04.0 DSL2. Saat ini, peralatan yang direferensikan oleh alur kerja harus disertakan dalam kontainer yang sesuai dengan OCI dan disimpan di registri privat di Amazon Elastic Container Registry (ECR). Definisi alur kerja harus menentukan output final spesifik. Hasil sementara akan dihapus ketika run alur kerja selesai. Caching run atau tugas alur kerja saat ini tidak didukung.

Alur kerja privat memungkinkan Anda untuk membawa skrip bioinformatika Anda sendiri yang ditulis dalam dua bahasa alur kerja yang paling umum digunakan, yaitu WDL dan Nextflow. Anda dapat menjalankan alur kerja privat ini dengan eksekusi tunggal, yang dikenal sebagai run. Untuk alur kerja privat, Anda hanya membayar apa yang Anda minta dan akan ditagih secara terpisah untuk tipe instans omik serta penyimpanan run. Semua tugas di alur kerja Anda dipetakan ke instans yang paling cocok dengan sumber daya yang telah ditentukan.

Alur kerja Ready2Run adalah alur kerja prabangun yang telah dirancang oleh perusahaan perangkat lunak pihak ketiga terkemuka di industri seperti Sentieon, Inc., NVIDIA, dan Element Biosciences bersama dengan pipeline sumber terbuka umum seperti alur kerja praktik terbaik GATK Broad Institute dan AlphaFold untuk prediksi struktur protein. Anda dapat menggunakan alur kerja Ready2Run untuk memproses data Anda dengan alur kerja yang paling umum digunakan seperti Germline dan GATK-8P Broad Institute. Alur kerja Ready2Run berbasis bayar per run dengan harga yang telah ditentukan sebelumnya. Hal ini berarti Anda akan dikenai biaya yang sama untuk setiap alur kerja.

Privasi dan Keamanan

AWS HealthOmics memenuhi persyaratan HIPAA. Anda dapat menggunakan kontrol akses berbasis atribut untuk menentukan siapa saja yang memiliki akses ke sumber daya AWS HealthOmics. Semua penyimpanan persisten mendukung kunci yang dikelola pelanggan. Izin baris dan kolom juga tersedia dengan penyimpanan analitik AWS HealthOmics. API AWS HealthOmics terintegrasi dengan log AWS CloudTrail dan Amazon CloudWatch untuk memungkinkan Anda menghasilkan asal data serta jejak audit akses yang mendetail.

AWS HealthOmics adalah layanan yang memenuhi persyaratan HIPAA. Jika Anda menyimpan informasi kesehatan yang dilindungi (PHI) di AWS, Anda harus memiliki BAA. Anda dapat segera masuk ke BAA secara online menggunakan AWS Artifact.