개요

AWS HealthOmics를 사용하면 사용한 만큼만 비용을 지불하면 됩니다. 저장하는 데이터의 양과 워크플로를 처리하는 데 사용하는 컴퓨팅 인스턴스에 따라 요금이 부과됩니다. AWS HealthOmics를 사용하면 시퀀스 및 참조 데이터 객체 또는 변형 및 주석 데이터를 저장할 수 있습니다. 또한 생물 정보학 워크플로를 실행하여 유전체, 전사체 및 기타 오믹스 데이터를 분석하고 변환할 수 있습니다. AWS HealthOmics는 오믹스 데이터의 저장 및 계산에 최적화되어 있으며 Amazon SageMaker, Amazon Simple Storage Service(S3), Amazon Athena와 같은 다른 AWS 서비스와 함께 작동합니다.

프리 티어

AWS 프리 티어의 일부로 AWS HealthOmics를 무료로 시작할 수 있습니다. 프리 티어는 첫 번째 AWS HealthOmics 리소스를 생성하는 첫 달부터 시작됩니다. 아래 표에 AWS HealthOmics 프리 티어에 대한 자세한 내용이 나와 있습니다.

 

처음 2개월간 월별 프리 티어 사용량

AWS HealthOmics 스토리지 활성 스토리지 클래스 1,500기가베이스-월 및 아카이브 스토리지 클래스 1,500기가베이스-월
AWS HealthOmics 워크플로

omics.m.xlarge 275인스턴스 시간(또는 이와 동등한 컴퓨팅 인스턴스) 및 스토리지 실행 4만 9,000 GB-시간

AWS HealthOmics 분석 200기가바이트-월

AWS HealthOmics 스토리지 요금

AWS HealthOmics 스토리지에 유전체 시퀀스를 저장하면 매월 기가베이스당 스토리지 비용을 지불합니다. 기가베이스는 가져온 시퀀스 파일(예: FASTQ, BAM, CRAM)의 10억 개 염기입니다. AWS HealthOmics 스토리지는 소스 파일에서 염기, 품질 점수, 정렬 및 기타 메타데이터를 저장합니다. 저장된 기가베이스당 비용을 지불하므로 최적의 파일 형식 또는 압축 기술에 대해 걱정할 필요가 없습니다. AWS HealthOmics가 사용자 대신 모든 것을 처리합니다.

시퀀스 객체는 읽기 세트라고 하며 FASTQ, BAM 또는 CRAM 파일과 논리적으로 동등합니다. AWS HealthOmics 스토리지는 읽기 세트를 위한 활성 스토리지 클래스 및 아카이브 스토리지 클래스를 제공합니다. 아카이브 클래스의 읽기 세트는 활성 클래스의 읽기 세트보다 월별 저장 비용이 낮습니다. 활성 클래스의 읽기 세트는 밀리초 단위로 액세스할 수 있으며 아카이브 클래스의 읽기 세트는 액세스 전에 활성화되어야 합니다. 읽기 세트는 30일 동안 액세스되지 않으면 다시 활성화될 때까지 자동으로 더 저렴한 아카이브 스토리지 클래스로 이동합니다.

읽기 세트에 대한 가져오기 비용은 없습니다. AWS HealthOmics 스토리지 데이터는 최소 스토리지 기간인 30일에 대한 요금이 부과되며, 30일 이전에 삭제된 데이터에 대해서는 잔여 일수에 대한 스토리지 요금과 동일한 비례 할당으로 계산된 요금이 적용됩니다. AWS HealthOmics 스토리지는 수명이 길지만 액세스 빈도가 낮은 데이터를 수년 동안 유지하도록 설계되었습니다.

읽기 세트 객체에 대한 GET 요청은 비용을 지불합니다. 읽기 세트에 대한 다른 모든 요청은 무료입니다.

AWS HealthOmics 분석 요금

AWS HealthOmics 분석은 Amazon Athena, Amazon SageMaker와 같은 광범위한 AWS 분석 및 기계 학습 서비스 제품군과 함께 사용할 유전체 변형 데이터 및 유전체 주석을 준비하는 데 도움이 됩니다. 원하는 양의 유전체 변형 데이터를 저장할 수 있으며 저장한 데이터에 대해서만 비용을 지불하면 됩니다. 데이터 크기는 변환된 데이터의 크기로 정의됩니다. 그러나 다른 서비스에서 데이터를 쿼리 및 분석하는 경우 해당 서비스 사용에 대한 비용을 지불합니다.

AWS HealthOmics 분석 데이터는 최소 스토리지 기간인 30일에 대한 요금이 부과되며, 30일 이전에 삭제된 데이터에 대해서는 잔여 일수에 대한 스토리지 요금과 동일한 비례 할당으로 계산된 요금이 적용됩니다.

AWS HealthOmics 프라이빗 및 Ready2Run 워크플로 요금

AWS HealthOmics는 프라이빗 및 Ready2Run 워크플로를 통해 생물정보학 워크플로의 실행도 관리합니다.

프라이빗 워크플로를 사용하면 가장 일반적으로 사용되는 워크플로 언어로 작성된 자체 생물정보학 스크립트를 가져올 수 있습니다. 한 번의 실행으로 프라이빗 워크플로를 실행할 수 있습니다. 요금은 요청한 항목에 대해서만 부과되며 오믹스 인스턴스 유형 및 실행 스토리지에 대한 요금이 별도로 청구됩니다. 워크플로 내의 모든 태스크는 정의된 리소스에 가장 적합한 인스턴스에 매핑됩니다. 예를 들어 8개의 CPU와 60GB RAM을 사용하도록 정의된 작업은 실행을 위해 omics.r.2xlarge 인스턴스 유형에 매핑됩니다.

Ready2Run 워크플로는 업계 서드 파티 소프트웨어 회사 및 오픈 소스 파이프라인에 의해 패키징되어 사전 구축되는 워크플로입니다. Ready2Run 워크플로를 간단히 사용하여 Germline 및 GATK-BP와 같이 가장 일반적으로 사용되는 워크플로를 통해 데이터를 처리할 수 있습니다. Ready2Run 워크플로는 실행 단위로 요금이 부과되므로 모든 워크플로에 대해 동일한 요금이 청구됩니다.

프라이빗 및 Ready2Run 워크플로 모두에서 워크플로 로그는 사용자 계정의 Amazon CloudWatch Logs에 저장되며 유지하는 동안 CloudWatch에서 요금이 청구됩니다. 단순화된 예산, 계획 및 회계를 위해 실행당 리소스 사용을 보고하도록 서비스를 구성할 수 있습니다.

  • 프라이빗 워크플로
  • Ready2Run 워크플로

요금 예

예제 1

한 집단 시퀀싱 프로젝트가 수집한 바이오뱅크에서 개인 시퀀싱을 시작합니다. 이 프로젝트는 유럽 서부(아일랜드) 리전에서 이 작업을 수행하도록 선택합니다. 각각 130기가베이스씩 10만 명의 개인을 시퀀싱하고 원시 시퀀싱 데이터를 AWS HealthOmics 스토리지에 저장합니다. 향후 5년 동안, 가져오기 후 30일이 경과하면 아카이브 스토리지 클래스에 유지되고 활성 스토리지 클래스로 전환되면 30일 동안 평균적으로 두 번 액세스됩니다. 각 유전체는 500개 파트로 다운로드됩니다. 따라서 500개의 GET API 호출이 생성됩니다. 단일 유전체에 대한 5년간 비용 합계는 다음과 같습니다.
활성 스토리지 클래스: 0.005769 USD/기가베이스/월 * 130기가베이스 * 90일 = 2.22 USD
아카이브 스토리지 클래스: 0.001154 USD/기가베이스/월 * 130기가베이스 * (1,825 - 90)일 = 8.56 USD
GET API: 0.005 USD/1,000회 API 호출 * (2 * 500회 API 호출) = 0.005 USD
5년간 비용 합계: 2.22 USD + 8.56 USD + 0.005 USD = 10.79 USD(또는 2.16 USD/연)

예제 2

한 생물 정보학 과학자가 미국 동부(버지니아 북부) 리전의 AWS HealthOmics 워크플로에서 Nextflow 워크플로를 실행하려고 합니다. 이 워크플로에는 3개의 태스크가 있습니다. 첫 번째 태스크는 16개의 vCPU와 30GB 메모리를 예약하고 실행하는 데 3시간이 걸립니다. 두 번째 태스크는 32개의 vCPU와 160GB 메모리를 예약하고 실행하는 데 2시간이 걸립니다. 세 번째 태스크는 4개의 vCPU와 10GB 메모리를 예약하고 실행하는 데 10분이 걸립니다. 그녀는 워크플로를 등록하고 기본 1,200GB 파일 시스템을 사용하여 StartRun API를 호출합니다. 전체 비용은 다음과 같습니다.
태스크 1(omics.c.4xlarge): 0.9180 USD/시간 * 3시간 = 2.754 USD
태스크 2(omics.r.8xlarge):
2.7216 USD/시간 * 2시간 = 5.4432 USD
태스크 3(omics.m.xlarge): 0.2592 USD/시간 * 1/6시간 = 0.0432 USD
스토리지: 0.0001918 USD/GB-시간 * (1,200GB*(3+2+1/6시간)) = 1.18916 USD
합계: 9.42956 USD

예제 3

한 데이터 과학자가 미국 동부(버지니아 북부) 리전의 Amazon Athena에서 3,202개의 VCF(Variant Call File) 파일을 분석하려고 합니다. 그는 변형 저장소를 생성하고 AWS HealthOmics API를 사용하여 이러한 파일을 수집합니다. 수집된 데이터의 크기는 1.5TB입니다. 그는 다음 달에 Athena에서 1,000개의 쿼리를 실행하여 서로 다른 하위 집단에 대한 대립 유전자 빈도를 계산합니다. 각 쿼리는 평균 50GB를 소비합니다. 월간 비용 합계는 다음과 같습니다.
변형 저장소: 0.035 USD/GB/월 * (1,024GB/TB * 1.5TB) = 53.76 USD
Amazon Athena: 5 USD/TB * 1,000 * 50/1,024 = 244.14 USD

예제 4

한 컴퓨터 사이언티스트가 미국 동부(버지니아 북부) 리전에서 30x 게놈에 대한 GATK-BP Germline fq2vcf Ready2Run 워크플로를 샘플 3개에 대해 실행하려고 합니다. 고객은 데이터를 입력하고 각 샘플에 대해 StartRun API를 호출합니다. 실행 3회에 대한 비용은 다음과 같습니다.
30x 게놈에 대한 GATK-BP Germline fq2vcf Ready2Run 워크플로: 10.00 USD/실행 * 3 = 30.00 USD
합계: 30.00 USD

추가 요금 리소스

AWS 요금 계산기

AWS에서 월별 비용을 손쉽게 계산

클라우드 경제 리소스 센터

AWS 전문가에게 맞춤 견적 받기