Обзор

В AWS HealthOmics вы платите только за то, что реально используете. Плата взимается в зависимости от объема хранимых данных и количества вычислительных инстансов, используемых вами для обработки рабочего потока. В AWS HealthOmics можно хранить объекты данных геномных последовательностей и эталонных данных или варианты и аннотационные данные. Можно также запускать рабочие потоки по биоинформатике для анализа и преобразования геномных, транскриптомных и других омических данных. AWS HealthOmics оптимизирован под хранение и обработку омических данных и работает с другими службами AWS, такими как Amazon SageMaker, Amazon Simple Storage Service (S3) и Amazon Athena.

Уровень бесплатного пользования

В рамках уровня бесплатного пользования AWS можно начать работу с сервисом AWS HealthOmics бесплатно. Уровень бесплатного пользования начинается с первого месяца создания вами своего первого ресурса AWS HealthOmics. Подробные сведения об уровне бесплатного пользования AWS HealthOmics приведены в таблице ниже.

 

Ежемесячное использование уровня бесплатного пользования в течение первых 2 месяцев

Хранилище AWS HealthOmics 1500 гигабаз в месяц в классе активного хранения и 1500 гигабаз в месяц в классе архивного хранения
Рабочие процессы AWS HealthOmics

275 часов работы инстанса omics.m.xlarge или эквивалентных вычислительных инстансов и 49 000 ГБ-часов хранилища запусков

Аналитика AWS HealthOmics 200 гигабайт в месяц

Цены на хранилище AWS HealthOmics

При использовании хранилища AWS HealthOmics для геномных последовательностей вы платите за хранение определенного количества гигабаз в месяц. 1 гигабаза – это 1 млрд пар оснований из импортированных вами файлов последовательностей (например, FASTQ, BAM или CRAM). В хранилище AWS HealthOmics хранятся основания, показатели качества, участки выравнивания и другие метаданные из исходных файлов. Вы платите за гигабазы хранимой информации, поэтому вам не нужно беспокоиться об оптимальных форматах файлов или методах сжатия. Обо всем этом за вас позаботится AWS HealthOmics.

Объекты последовательностей называются читаемыми множествами и логически эквивалентны файлам FASTQ, BAM или CRAM. Хранилище AWS HealthOmics предоставляет под ваши читаемые множества классы активного и архивного хранения. Месячная плата за хранение читаемых множеств в архивном классе ниже, чем в активном классе. Доступ к читаемым множествам из активного класса происходит за миллисекунды, в то время как перед получением доступа к читаемым множествам из архивного уровня их нужно активировать. Если в течение 30 дней обращений к читаемым множествам не было, они автоматически перемещаются в более дешевый класс архивного хранения до тех пор, пока их снова не активируют.

Плата за импорт читаемых множеств не взимается. Минимальный оплачиваемый срок хранения в хранилище AWS HealthOmics составляет 30 дней. За данные, которые были удалены до истечения 30-дневного срока, взимается плата, пропорциональная стоимости хранения за оставшиеся дни. Хранилище AWS HealthOmics предназначено для данных долговременного (в течение лет) хранения и нечастого доступа.

Вы платите за GET-запросы к объектам читаемых множеств. Любые другие типы запросов к читаемым множествам являются бесплатными.

Цены на аналитику AWS HealthOmics

Аналитика AWS HealthOmics помогает вам готовить данные о геномных вариантах и геномные аннотации для использования в целом ряде сервисов аналитики и машинного обучения AWS, например Amazon Athena и Amazon SageMaker. Вы можете хранить любое количество данных о геномных вариантах и платить только за то, что храните. Размер данных определяется как размер преобразованных данных. Впрочем, при запросах к другим службам и проведении анализа данных в них вы платите за использование этих служб.

Минимальный оплачиваемый срок хранения аналитических данных в AWS HealthOmics составляет 30 дней. За данные, которые были удалены до истечения 30-дневного срока, взимается плата пропорциональная стоимости хранения за оставшиеся дни.

Цены на частные рабочие процессы AWS HealthOmics и рабочие процессы Ready2Run

AWS HealthOmics также управляет выполнением рабочих процессов биоинформатики с помощью частных рабочих процессов и рабочих процессов Ready2Run.

Частные рабочие процессы позволяют использовать собственные сценарии биоинформатики, написанные на наиболее часто используемых языках рабочих процессов. Частные рабочие процессы можно запускать одним выполнением. Вы платите только за запросы. Счета выставляются отдельно за типы инстансов Omics и отдельно – за хранилище запусков. Все задачи в вашем рабочем потоке связываются с инстансом, который лучше всего подходит для заданных в них ресурсов. Например, задача, для выполнения которой требуется 8 процессоров и 60 ГБ оперативной памяти, будет связана с типом инстанса omics.r.2xlarge.

Рабочие процессы Ready2Run – это готовые рабочие процессы, упакованные сторонними отраслевыми компаниями-разработчиками программного обеспечения и конвейерами с открытым исходным кодом. Вы можете просто использовать рабочие процессы Ready2Run для обработки данных с помощью наиболее часто используемых рабочих процессов, таких как Germline и GATK-BP. Рабочие процессы Ready2Run оплачиваются отдельно, то есть за каждый рабочий процесс взимается одинаковая цена.

И в частных рабочих процессах, и в рабочих процессах Ready2Run журналы рабочих потоков хранятся среди журналов Amazon CloudWatch в вашем аккаунте. Счета за журналы рабочих потоков выставляются в CloudWatch до тех пор, пока вы их храните. Для упрощения составления бюджета, планирования и учета можно настроить службу так, чтобы она предоставляла отчеты об использовании ресурсов за запуск.

  • Частные рабочие процессы
  • Рабочие процессы Ready2Run

Примеры расчета цен

Пример №1

В рамках инициативы по секвенированию населения начинается секвенирование людей из собранного биобанка. Провести его решено на западе ЕС (в Ирландии). Секвенируются 100 000 человек с получением 130 гигабаз на каждого и хранением необработанных данных секвенирования в хранилище AWS HealthOmics. Через 30 дней после импорта они на 5 лет отправляются в класс архивного хранения. К ним обращаются в среднем дважды, и тогда они на 30 дней переходят в класс активного хранения. Все геномы загружается в 500 частях, генерируя 500 вызовов API GET. Общая стоимость за один геном в течение 5 лет составляет:
Класс активного хранения: 0,005769 USD гигабаз/месяц * 130 гигабаз * 90 дней = 2,22 USD
Класс архивного хранения: 0,001154 USD гигабаз/месяц * 130 гигабаз * (1825 – 90) дней = 8,56 USD.
Вызовы API GET: 0,005 USD / 1000 вызовов API * (2 * 500 вызовов API) = 0,005 USD
Общая стоимость за 5 лет: 2,22 USD + 8,56 USD + 0,005 USD = 10,79 USD (или 2,16 USD в год)

Пример 2

Ученая-биоинформатик хочет запустить рабочий поток Nextflow в рабочих потоках AWS HealthOmics на Востоке США (Северная Вирджиния). Ее рабочий поток состоит из 3 задач. Под первую резервируется 16 vCPU, 30 ГБ памяти и 3 часа работы. Под вторую требуется 32 vCPU, 160 ГБ памяти и 2 часа работы. Под первую резервируется 4 vCPU, 10 ГБ памяти и 10 минут работы. Клиент регистрирует рабочий поток и вызывает API StartRun с файловой системой по умолчанию (1200 ГБ). Ее общие расходы составляют:
Задача №1 (omics.c.4xlarge): 0,9180 USD/час * 3 часа = 2,754 USD
Задача №2 (omics.r.8xlarge):
2,7216 USD/час * 2 часа = 5,4432 USD
Задача №3 (omics.m.xlarge): 0,2592 USD/час * 1/6 часа = 0,0432 USD
Хранилище: 0,0001918/ГБ в час * (1200 ГБ*(3 часа+2 часа+1/6 часа)) = 1,18916 USD
Итого: 9,42956 USD

Пример №3

У специалиста по анализу данных есть 3202 файла вариантов формата вызова (VCF), которые он хочет проанализировать с помощью Amazon Athena на Востоке США (Северная Вирджиния). Он создает хранилище вариантов и загружает эти файлы с использованием AWS HealthOmics API. Размер загруженных файлов составляет 1,5 ТБ. В течение следующего месяца он обрабатывает в Athena 1000 запросов по расчету частоты аллелей для различных подсовокупностей, каждый из которых в среднем занимает 50 ГБ. Его общие ежемесячные расходы составляют:
Хранилище вариантов: 0,035 USD ГБ/месяц * (1024 ГБ/ТБ * 1,5 ТБ) = 53,76 USD
Amazon Athena: 5 USD / ТБ * 1000 * 50 / 1024 = 244,14 USD

Пример 4

Специалист по вычислениям хочет запустить рабочий процесс GATK-BP Germline fq2vcf для 30-кратного генома Ready2Run в регионе Восток США (Северная Вирджиния) для 3 образцов. Клиент вводит свои данные и вызывает API StartRun для каждого образца. Стоимость трех запусков составляет:
Рабочий процесс GATK-BP Germline fq2vcf для 30-кратного генома Ready2Run: 10,00 USD/запуск * 3 = 30,00 USD
Всего: 30,00 USD

Дополнительные ресурсы по ценам

Калькулятор цен AWS

Простой расчет ежемесячных расходов на AWS

Центр ресурсов по облачной экономике

Связаться со специалистами AWS и получить индивидуальное предложение