Amazon Omics облегчает хранение, обработку запросов и анализ геномных, транскриптомных и других омических данных, а также формирование выводов из этих данных. Это упрощает и ускоряет процессы хранения и анализа мультиомической информации для исследовательского и клинического применения, предоставляя возможность сосредоточиться на получении более глубоких выводов из имеющихся данных.
Хранилище Amazon Omics позволяет эффективно, с низкими затратами хранить петабайты омических данных, обеспечивая возможность научных открытий в масштабах популяций. Рабочие процессы Amazon Omics автоматизируют предоставление и масштабирование вычислительной инфраструктуры, что позволяет запускать конвейеры биоинформационного анализа в производственных масштабах, тратить меньше времени на управление инфраструктурой и больше – на проведение исследований. Аналитика Amazon Omics упрощает подготовку омических данных для мультимодального анализа, позволяя объединить мультиомические данные с данными из медицинских карт для подбора более точной, персонализированной терапии. Данные возможности также отвечают требованиям HIPAA.
Общие вопросы
Специализированное хранилище
Хранилище Amazon Omics совместимо с такими форматами биоинформационных файлов, как FASTQ, BAM и CRAM, что позволяет эффективно и недорого хранить, анализировать и совместно использовать такие данные. Эти файловые форматы хранятся как объекты читаемых множеств в хранилище последовательностей. Эталонные геномы можно также хранить в формате FASTA. Данные импортируются в виде неизменяемых объектов с уникальными идентификаторами для поддержки рабочих нагрузок, требующих строгого подтверждения происхождения данных. Доступ к отдельным объектам данных, включая эталонные объекты и объекты читаемых множеств, можно контролировать с помощью тегов и элементов управления доступом на основе атрибутов через управление идентификацией и доступом (AWS IAM). Для сокращения расходов на долгосрочное хранение объекты данных, к которым в течение 30 дней доступ не производился, автоматически перемещаются в архивный класс хранения. Активировать архивные объекты можно в любой момент с помощью вызова API.
Рабочие процессы биоинформационных задач
Amazon Omics помогает запускать масштабные биоинформационные рабочие процессы. Задайте описание рабочего процесса, укажите инструменты, которыми бы хотели воспользоваться, и данные для анализа, и Amazon Omics предоставит базовую инфраструктуру и реализует рабочий процесс. Поддерживаются описания рабочих процессов, соответствующие спецификациям WDL 1.1 и Nextflow 22.04.0 DSL2. Рабочие процессы используют OCI-совместимые контейнерные инструменты, хранящиеся в частных реестрах Реестра эластичных контейнеров Amazon (Amazon ECR). Можно анализировать данные из корзин S3 или хранилищ последовательностей Amazon Omics. Вы сможете контролировать, у кого к каким рабочим процессам будет доступ и каково будет общее количество используемых ресурсов. С помощью групп выполнения рабочих процессов вы также сможете управлять приоритетами реализации.
Масштабируемая аналитика
С помощью Amazon Omics можно быстро загружать и преобразовывать в Apache Parquet такие форматы геномных данных, как (g)VCF, GFF3 и TSV/CSV. Геномные данные можно сделать доступными через аналитические сервисы, например, Amazon Athena. Можно преобразовывать как вариантные (полученные из отдельного образца), так и аннотационные данные (известную информацию о позициях геномов). Доступ к хранилищам аналитики можно контролировать с помощью AWS Lake Formation, что при реализации тонкого контроля доступа упрощает выполнение запросов к различным источникам данных. Так, в целях развития точной медицины можно безопасно объединять геномные данные человека с историей его болезни из Amazon HealthLake (там может содержаться история лечения, назначенных лекарств или результаты лабораторных анализов).
Проверка и совместная обработка данных
Amazon Omics облегчает исследователям тегирование партнеров, настройку выданных им разрешений и безопасный обмен данными с ними. Это упрощает процесс открытия ваших омических данных для поиска, доступа, совместного и повторного использования. С помощью специфичных для конкретной области метаданных можно связывать хранилища данных на Amazon Omics с другими омическими и медицинскими данными, тем самым облегчая мультиомический и смешанный анализ.
Безопасность, конфиденциальность и соответствие требованиям
Соответствие требованиям HIPAA
Amazon Omics соответствует требованиям HIPAA. Для тонкого определения доступа к данным и возможностей управления ими можно применить средства контроля на основе атрибутов. Встроенная функция комплексного ведения журналов и сбора информации о происхождении данных позволяет узнать, к каким данным кто и когда обращался.