AWS HealthOmics FAQ

일반

AWS HealthOmics는 의료 및 생명 과학 조직과 조직의 소프트웨어 파트너가 유전체, 전사체 및 기타 오믹스 데이터를 저장, 쿼리, 분석하고 해당 데이터에서 건강을 개선할 수 있는 인사이트를 창출할 수 있는 특별히 구축된 서비스입니다. 이 서비스는 대규모 분석 및 협업 연구를 지원합니다.

AWS HealthOmics는 오믹스 데이터를 준비 및 분석하기 위한 확장 가능한 워크플로 및 통합 도구를 제공하고 기본 인프라를 자동으로 프로비저닝하고 크기를 조정하므로 연구 및 혁신에 더 많은 시간을 할애할 수 있습니다. AWS HealthOmics는 대규모 분석 및 협업 연구를 지원합니다.

AWS HealthOmics는 AWS HealthOmics 프라이빗 워크플로 및 Ready2Run 워크플로를 사용하여 Amazon Simple Storage Service(S3) 또는 AWS HealthOmics 스토리지에서 직접 데이터를 처리할 수 있습니다. 원시 유전체 시퀀스 파일, VCF(Variant Call File) 파일, 주석 데이터 세트와 같은 데이터를 Amazon S3에서 생물 정보학 호환 AWS HealthOmics 스토리지 및 분석 저장소로 가져올 수 있습니다. AWS Lake Formation을 사용하여 AWS HealthOmics 변형 및 주석 스토어에 대한 액세스를 제어하며, Amazon Athena를 사용하여 더 간편하게 데이터를 쿼리하고 Amazon HealthLake의 의료 기록과 같은 다른 형식의 데이터와 결합할 수 있습니다. 또한 Amazon Athena를 사용하여 더 간편하게 데이터를 쿼리하고 Amazon HealthLake의 의료 기록과 같은 다른 형식의 데이터와 결합할 수 있습니다. 또한 고급 분석을 위해 Amazon QuickSight에서 변환된 데이터를 사용할 수 있습니다. Amazon SageMaker를 사용하여 다중 오믹 및 다중 모드 데이터에서 새로운 기계 학습 알고리즘을 빌드, 훈련 및 배포할 수도 있습니다. 마지막으로 Amazon EventBridge를 사용하여 이벤트를 이벤트 기반 아키텍처의 일부로 게시할 수도 있습니다.

데이터 저장소에는 2가지 유형이 있습니다. 한 저장소에는 원시 생물학적 데이터가 저장되고 다른 저장소에는 변형 및 주석 데이터가 저장됩니다. AWS HealthOmics 스토리지는 FASTA 형식 참조 유전체와 gzip으로 압축된 FASTQ, BAM 및 CRAM 형식 원시 시퀀스 파일을 가져올 수 있습니다. AWS HealthOmics 분석 저장소는 변형 데이터용 (g)VCF 형식 파일과 유전체 주석용 VCF, GFF 및 TSV/CSV 파일을 가져올 수 있습니다. AWS HealthOmics 워크플로는 정의된 워크플로 정의 및 도구가 지원하는 모든 데이터를 AWS HealthOmics 스토리지 또는 Amazon S3에서 읽을 수 있습니다.

AWS HealthOmics 워크플로는 WDL 1.1 사양 또는 Nextflow 22.04.0 DSL2를 준수하는 워크플로 정의를 지원합니다. 현재, 워크플로에서 참조하는 도구는 OCI 호환 컨테이너에 캡슐화되고 Amazon Elastic Container Registry(ECR)의 프라이빗 레지스트리에 저장되어야 합니다. 워크플로 정의는 특정 최종 출력을 정의해야 합니다. 워크플로 실행이 완료되면 중간 결과는 삭제됩니다. 현재로서는 워크플로 실행 또는 태스크 캐싱은 지원되지 않습니다.

프라이빗 워크플로를 사용하면 가장 일반적으로 사용되는 2가지 워크플로 언어(WDL 및 Nextflow)로 작성된 자체 생물정보학 스크립트를 가져올 수 있습니다. 이러한 프라이빗 워크플로를 한 번의 실행으로 실행할 수 있는데, 이를 실행이라고 합니다. 프라이빗 워크플로의 경우 요금은 요청한 항목에 대해서만 부과되며 오믹스 인스턴스 유형 및 실행 스토리지에 대한 요금이 별도로 청구됩니다. 워크플로 내의 모든 태스크는 정의된 리소스에 가장 적합한 인스턴스에 매핑됩니다.

Ready2Run 워크플로는 Sentieon, Inc., NVIDIA 및 Element Biosciences와 같은 업계 최고의 서드 파티 소프트웨어 회사에서 Broad Institute의 GATK 모범 사례 워크플로 및 단백질 구조 예측을 위한 AlphaFold와 같은 일반적인 오픈 소스 파이프라인과 함께 설계한 사전 구축된 워크플로입니다. Ready2Run 워크플로를 간단히 사용하여 Germline 및 Broad Institute의 GATK-8P와 같이 가장 일반적으로 사용되는 워크플로를 통해 데이터를 처리할 수 있습니다. Ready2Run 워크플로 요금은 미리 결정된 요금으로 실행당 부과됩니다. 즉, 모든 워크플로에 대해 동일한 요금이 청구됩니다.

프라이버시 및 보안

AWS HealthOmics는 HIPAA 적격 서비스입니다. 속성 기반 액세스 제어를 사용하여 AWS HealthOmics 리소스에 액세스할 수 있는 사용자를 정의할 수 있습니다. 모든 영구 스토리지는 고객 관리형 키를 지원합니다. 행 및 열 권한도 AWS HealthOmics 분석 저장소에서 사용할 수 있습니다. AWS HealthOmics API는 AWS CloudTrail 및 Amazon CloudWatch Logs와 통합되므로 자세한 데이터 출처를 생성하고 감사 추적에 액세스할 수 있습니다.

AWS HealthOmics는 HIPAA 적격 서비스입니다. AWS에 개인 건강 정보(PHI)를 저장하는 경우 BAA가 있어야 합니다. AWS Artifact를 사용하여 온라인에서 신속하게 BAA를 체결할 수 있습니다.