Amazon Omics를 사용하면 유전체, 전사체 및 기타 오믹스 데이터를 더 쉽게 저장, 쿼리, 분석한 다음 해당 데이터에서 인사이트를 생성할 수 있습니다. 연구 및 임상 응용 분야용 다중 오믹 정보를 저장하고 분석하는 프로세스를 단순화하고 가속화하므로 데이터에서 더 심층적인 인사이트를 얻는 데 집중할 수 있습니다.

Amazon Omics 스토리지에서는 페타바이트 규모의 오믹스 데이터를 효율적이고 비용 효과적으로 저장할 수 있으므로 집단 규모에서 과학적 발견이 가능합니다. Amazon Omics 워크플로는 컴퓨팅 인프라의 프로비저닝 및 크기 조정을 자동화하므로 프로덕션 규모에서 생물 정보학 분석 파이프라인을 실행하고 인프라 관리 시간을 절약하여 연구 수행에 더 많은 시간을 할애할 수 있습니다. Amazon Omics 분석은 다중 모드 분석을 위한 오믹스 데이터 준비를 간소화하여 다중 오믹 및 건강 기록 데이터를 함께 가져오고 보다 표적화 및 개인화된 치료를 생성할 수 있도록 합니다. 이들은 또한 HIPAA 적격 기능입니다.

일반

특별히 구축된 스토리지

Amazon Omics 스토리지는 FASTQ, BAM, CRAM과 같은 생물 정보학 파일 형식과 호환되며 이 데이터를 효율적이고 저렴한 비용으로 저장, 검색, 공유할 수 있습니다. 이러한 파일 형식은 시퀀스 저장소 내에 읽기 세트 객체로 저장됩니다. 참조 유전체를 FASTA 형식으로 저장할 수도 있습니다. 데이터는 엄격한 데이터 출처를 요구하는 워크로드를 지원하기 위해 고유한 식별자가 있는 변경 불가능한 객체로 가져옵니다. 참조 및 읽기 세트 객체를 포함한 개별 데이터 객체에 대한 액세스는 AWS Identity and Access Management(IAM)를 통해 태그 및 속성 기반 액세스 제어를 사용하여 제어할 수 있습니다. 장기 스토리지 비용을 줄이기 위해 30일 동안 액세스되지 않은 데이터 객체는 자동으로 아카이브 스토리지 클래스로 이동됩니다. 아카이브된 객체는 언제든지 API 호출을 통해 다시 활성화할 수 있습니다.

생물 정보학 워크플로

Amazon Omics는 대규모로 생물 정보학 워크플로를 실행하는 데 도움이 됩니다. 워크플로 정의, 사용할 도구, 분석할 데이터를 지정하면 Amazon Omics가 기본 인프라를 프로비저닝하고 워크플로를 구현합니다. WDL 1.1 및 Nextflow 22.10.0 DSL2 사양을 준수하는 워크플로 정의가 지원됩니다. 워크플로는 Amazon Elastic Container Registry(ECR)의 프라이빗 레지스트리에 저장된 OCI 호환 컨테이너식 도구를 사용합니다. S3 버킷 또는 Amazon Omics 시퀀스 저장소의 데이터를 분석할 수 있습니다. 특정 워크플로에 액세스할 수 있는 사용자를 제어하고, 총 리소스 사용량을 제어하고, 워크플로 실행 그룹을 통해 구현 우선 순위를 관리할 수 있습니다.

대규모 분석

Amazon Omics를 사용하면 (g)VCF, GFF3, TSV/CSV와 같은 유전체학 데이터 형식을 빠르게 수집하고 Apache Parquet로 변환할 수 있습니다. Amazon Athena와 같은 분석 서비스를 통해 유전체학 데이터에 액세스할 수 있습니다. 변형 데이터(개별 샘플의 데이터)와 주석 데이터(유전체에서의 위치에 대한 알려진 정보)를 모두 변환할 수 있습니다. AWS Lake Formation을 사용하여 분석 저장소에 대한 액세스를 제어할 수 있으므로 세분화된 액세스 제어를 구현하면서 다양한 데이터 소스에서 더 간편하게 쿼리를 수행할 수 있습니다. 예를 들어 개인의 유전체 데이터를 이전 치료, 약물 또는 검사실 보고서를 포함할 수 있는 Amazon HealthLake의 의료 기록과 안전하게 결합하여 정밀 의료를 촉진할 수 있습니다.

데이터 협업 및 출처

Amazon Omics를 사용하면 연구원이 협업자에 태그를 지정하고, 협업자의 권한을 설정하고, 안전하게 협업자와 데이터를 공유할 수 있습니다. 그러므로 오믹스 데이터를 FAIR(검색 가능, 액세스 가능, 상호 운용 가능, 재사용 가능)로 만드는 방법이 간소화됩니다. 도메인별 메타데이터를 사용하면 Amazon Omics 데이터 저장소를 다른 오믹스 및 의료 데이터와 연결하여 다중 오믹 및 다중 모두 분석을 용이하게 만들 수 있습니다.

보안, 개인정보 보호 및 규정 준수

HIPAA 적격

Amazon Omics는 HIPAA 적격 서비스입니다. 속성 기반 제어를 적용하여 세분화된 데이터 액세스 및 거버넌스를 정의할 수 있습니다. 포괄적인 로깅 및 출처 캡처 기능을 기본 제공하므로 어떤 데이터에 누가, 언제 액세스했는지 알 수 있습니다.