참조 배포

Illumina DRAGEN on AWS

차세대 염기서열 데이터 분석

이 파트너 솔루션은 Amazon Web Services(AWS) 클라우드에 Illumina DRAGEN(Dynamic Read Analysis for GENomics) Bio-IT Platform을 배포합니다.

DRAGEN Bio-IT Platform을 사용하면 차세대 염기서열 분석(NGS) 데이터를 매우 빠르게 분석하고, 게놈 데이터를 분석하는 데 걸리는 시간을 단축하며, 정확도를 높일 수 있습니다. 여기에는 매핑, 맞춤, 정렬, 중복 표시 및 하플로타입 이형 호출에 최적화된 알고리즘을 제공하는 생물 정보학 파이프라인이 포함되어 있습니다. 이러한 파이프 라인에는 생식선, 체세포(종양 및 종양/정상), RNA, 단일 세포 RNA, 메틸화, 관절 유전형 분석 및 DRAGEN-GATK가 포함됩니다.

이 파트너 솔루션은 고가용성을 위해 2개의 가용 영역에 걸쳐 AWS 환경을 구축하고 스팟 인스턴스와 온디맨드 인스턴스를 위해 2개의 AWS Batch 컴퓨팅 환경을 프로비저닝합니다. 이러한 환경에는 하드웨어 가속화를 위해 FPGA(Field-Programmable Gate Array)에 연결되는 DRAGEN F1 인스턴스가 포함되어 있습니다.

Illumina 로고

이 파트너 솔루션은 Illumina와 AWS가 공동으로 개발했습니다. Illumina는 AWS 파트너입니다.


AWS Service Catalog 관리자는 이 아키텍처를 자체 카탈로그에 추가할 수 있습니다.  

  •  구축할 내용
  • 이 파트너 솔루션을 사용하면 AWS에 다음과 같은 구성 가능한 환경을 설정할 수 있습니다.

    • 두 가용 영역에 걸쳐 있는 고가용성 아키텍처*
    • AWS 모범 사례에 따라 퍼블릭 및 프라이빗 서브넷으로 구성된 가상 프라이빗 클라우드(VPC). 이는 배포를 위한 네트워크 인프라를 제공합니다.*
    • 인터넷 액세스를 제공하는 인터넷 게이트웨이.*
    • 퍼블릭 서브넷에서, 프라이빗 서브넷의 리소스에 대한 아웃바운드 인터넷 액세스를 허용하기 위한 관리형 NAT 게이트웨이.*
    • Docker 이미지를 생성하고 Amazon Elastic Container Registry(Amazon ECR) 리포지토리로 업로드하는 AWS CodePipeline 파이프라인.
    • 2개의 AWS Batch 컴퓨팅 환경: Amazon Elastic Compute Cloud(Amazon EC2) 스팟 인스턴스용 1개와 온디맨드 인스턴스용 1개.
    • 스팟 인스턴스용 컴퓨팅 환경에 우선적으로 업로드하여 비용을 최적화하는 AWS Batch 작업 대기열.
    • DRAGEN을 실행하기 위한 AWS Batch 작업 정의.
    • AWS Batch 작업을 실행하기 위한 AWS Identity and Access Management(IAM) 역할 및 정책.

    * 기존 VPC에 파트너 솔루션을 배포하는 템플릿에서는 별표로 표시된 태스크를 건너뛰고 기존 VPC 구성을 묻는 메시지가 표시됩니다.

  •  배포 방법
  • Illumina DRAGEN을 배포하려면, 배포 가이드의 지침을 따르세요. 배포 프로세스에는 다음 단계가 포함됩니다.

    1. 아직 AWS 계정이 없으면 https://aws.amazon.com에서 가입합니다.
    2. AWS Marketplace에서 DRAGEN Bio-IT Platform을 구독합니다.
    3. 파트너 솔루션을 시작합니다. 각 배포에는 약 15분이 걸립니다. 다음 2가지 옵션 중에서 선택할 수 있습니다.
    4. DRAGEN 작업을 실행하여 배포를 테스트합니다.

    배포를 사용자 지정하려면 네트워크 아키텍처를 구성하고, AWS Batch 환경에서 원하는 가상 CPU 수를 설정하고, 스팟 인스턴스 입찰 백분율을 지정하고, AWS Batch 작업 재시도 횟수를 설정합니다.

    Amazon은 이 솔루션에서 AWS와 협업하는 AWS 파트너와 사용자 배포 정보를 공유할 수 있습니다.  

  •  비용 및 라이선스
  • 이 파트너 솔루션에는 DRAGEN Bio-IT Platform용 Amazon Machine Image(AMI) 구독이 필요합니다. 이 AMI는 AWS Marketplace에서 시간 단위 요금으로 구독할 수 있습니다.

    이 솔루션을 실행하는 동안 사용되는 AWS 서비스 및 유료 타사 라이선스 비용은 고객이 부담해야 합니다. 솔루션 사용에 따른 추가 비용은 없습니다.

    이 솔루션에는 사용자 지정할 수 있는 구성 파라미터가 포함되어 있습니다. 인스턴스 유형과 같은 이러한 일부 설정에 따라 배포 비용이 달라집니다. 예상 비용은 사용하는 각 AWS 서비스의 요금 페이지를 참조하세요. 요금은 변경될 수 있습니다.

    팁: 솔루션 배포 후 관련 비용을 추적할 수 있도록 AWS Cost and Usage Report를 생성하세요. 이 보고서는 계정의 Amazon Simple Storage Service(S3) 버킷에 대한 과금 지표를 제공합니다. 이 보고서는 매월 사용량을 기반으로 한 추정 요금을 제공하고 월말에 데이터를 집계합니다. 자세한 내용은 AWS Cost and Usage Reports란 무엇인가요?를 참조하세요.