이 지침은 프로덕션 등급의 생물정보학 워크플로를 대규모로 구축하고 실행하는 방법을 보여줍니다. 자동화, 워크플로 분석, 스토리지, 운영 및 비용 관찰성에 AWS 서비스를 사용하면 DevOps 모범 사례에 따라 생물정보학 워크플로의 수명 주기를 관리할 수 있습니다. 이 아키텍처를 자체 인프라의 기반으로 사용하고 필요에 따라 특정 측면을 업데이트하여 환경에 통합하고 요구 사항을 충족할 수 있습니다.

참고: [고지 사항]

아키텍처 다이어그램

[아키텍처 다이어그램 설명]

아키텍처 다이어그램(PDF) 다운로드 

Well-Architected 원칙

AWS Well-Architected Framework는 클라우드에서 시스템을 구축하는 동안 사용자가 내리는 의사 결정의 장단점을 이해하는 데 도움이 됩니다. 이 프레임워크의 6가지 원칙을 통해 안정적이고 안전하며 효과적이고 비용 효율적이며 지속 가능한 시스템을 설계 및 운영하기 위한 아키텍처 모범 사례를 배울 수 있습니다. AWS Management Console에서 추가 요금 없이 사용할 수 있는 AWS Well-Architected Tool을 사용하면 각 원칙에 대한 여러 질문에 답하여 이러한 모범 사례와 비교하며 워크로드를 검토할 수 있습니다.

위의 아키텍처 다이어그램은 Well-Architected 모범 사례를 고려하여 생성된 솔루션의 예시입니다. Well-Architected를 완전히 충족하려면 가능한 많은 Well-Architected 모범 사례를 따라야 합니다.

  • 이 지침은 AWS CodeCommit, AWS CodeBuildAWS CodePipeline을 사용하여 버전 제어를 생성하고 생물정보학 워크플로의 소스 코드 구축 및 배포를 자동화합니다. 또한 DynamoDB를 사용하여 HealthOmics의 출력 파일을 추적하고 메타데이터를 실행할 수 있습니다. 이 지침은 DevOps 모범 사례를 사용하여 워크플로 코드를 관리하고 워크플로 실행 메타데이터를 보여줍니다. 따라서 점진적 변경을 통해 정확한 결과를 얻을 수 있습니다. 워크플로 실행 메타데이터를 추적하면 관련 워크플로의 실행 상태 및 출력 파일을 쉽게 찾아 다운스트림 보고 또는 과학적 분석을 수행할 수 있습니다.

    운영 우수성 백서 읽기 
  • 이 지침은 AWS Key Management Service(AWS KMS)를 사용하여 저장 시 암호화를 제공하고 DataSync를 사용하여 모든 네트워크 트래픽에 대한 전송 중 암호화를 제공합니다. 또한 AWS Identity and Access Management(IAM)로 잠재적으로 민감한 데이터에 대한 세분화된 액세스 제어를 제공하여 권한 있는 사용자만 특정 작업을 수행하여 데이터를 처리하고 분석하도록 할 수 있습니다.

    보안 백서 읽기 
  • 이 지침을 통해 HealthOmics를 사용하여 계산 집약적인 생물정보학 워크플로를 대규모로 조정할 수 있습니다. 이 서비스에는 실수로 인한 오버프로비저닝을 방지하기 위한 특정 서비스 할당량(예: 가상 CPU 수)이 있습니다. 또한 Amazon S3DynamoDB는 기본 제공 백업을 통해 고가용성을 제공합니다. 또한 이 지침은 EventBridge를 사용하여 실패와 같은 이벤트를 캡처하며, 이에 대한 대응으로 Amazon SNS를 통한 실시간 알림을 제공하여 적절한 조치를 취하도록 합니다. HealthOmics 워크플로 및 기본 도구에 대한 정보가 담긴 세부 로그를 제공하는 Amazon CloudWatch를 사용하여 이벤트를 빠르게 조사할 수 있습니다.

    신뢰성 백서 읽기 
  • 이 지침을 사용하면 특정 태스크에 대한 동시 워크플로를 다양한 CPU 및 메모리 구성으로 실행할 수 있습니다. 필요한 CPU, 메모리 및 스토리지를 지정하여 리소스를 요청할 수 있습니다. 그러면 HealthOmics가 적절한 인프라를 프로비저닝합니다. 이 기능은 비즈니스 요구 사항에 따라 적절한 리소스로 규모를 조정하는 데 도움이 됩니다.

    성능 효율성 백서 읽기 
  • 이 지침은 HealthOmics 서열 스토어를 사용합니다. 서열 스토어를 사용하면 기가베이스당 저렴한 비용으로 페타바이트 규모의 유전체 데이터 파일을 효율적으로 저장 및 공유할 수 있으므로 Amazon S3에 비해 비용이 절감됩니다. 또한 AWS CUR을 사용하여 AWS 비용 및 사용량에 대한 가장 상세한 정보에 액세스하고, 최적화가 필요한 영역을 식별하고, 프로젝트, 부서 또는 사용자와 같은 속성을 기반으로 비즈니스 동향을 이해할 수 있습니다.

    비용 최적화 백서 읽기 
  • 이 지침은 자체 인프라를 프로비저닝하고 관리할 필요 없이 프로젝트가 환경에 미치는 영향을 최소화하는 데 도움이 되는 관리형 및 서버리스 서비스를 사용합니다. HealthOmics는 워크플로 실행을 요청할 때만 리소스를 프로비저닝하고 완료 시 리소스를 해제합니다. 마찬가지로 Lambda를 사용하여 자체 서버를 프로비저닝하지 않고도 소규모 태스크를 함수로 실행할 수 있습니다.

    지속 가능성 백서 읽기 

구현 리소스

실험 및 사용을 위한 자세한 안내는 AWS 계정 내에서 제공됩니다. 배포, 사용, 정리를 포함한 지침 구축의 각 단계는 검토되어 배포를 위해 준비됩니다.

시작점으로서 샘플 코드를 제공합니다. 이 샘플 코드는 업계에서 검증되었고 규범적이지만 최종적인 것은 아니며, 시작하는 데 도움을 줄 것입니다.

고지 사항

샘플 코드, 소프트웨어 라이브러리, 명령줄 도구, 개념 증명, 템플릿 또는 기타 관련 기술(AWS 직원을 통해 제공되는 상기 항목 포함)은 AWS 이용계약 또는 귀하와 AWS 간의 서면 계약(적용되는 것)에 따라 AWS 콘텐츠로 제공됩니다. 이 AWS 콘텐츠를 프로덕션 계정, 프로덕션 또는 기타 중요한 데이터에 사용해서는 안 됩니다. 귀하는 특정 품질 제어 방식 및 표준에 따라 프로덕션급 사용에 적절하게 샘플 코드와 같은 AWS 콘텐츠를 테스트, 보호 및 최적화할 책임이 있습니다. AWS 콘텐츠를 배포하면 Amazon EC2 인스턴스를 실행하거나 Amazon S3 스토리지를 사용할 때와 같이 요금이 부과되는 AWS 리소스를 생성하거나 사용하는 것에 대한 AWS 요금이 발생할 수 있습니다.

본 지침에 서드 파티 서비스 또는 조직이 언급되어 있다고 해서 Amazon 또는 AWS와 서드 파티 간의 보증, 후원 또는 제휴를 의미하지는 않습니다. AWS의 지침을 기술적 시작점으로 사용할 수 있으며 아키텍처를 배포할 때 서드 파티 서비스와의 통합을 사용자 지정할 수 있습니다.

이 페이지의 내용이 도움이 되었나요?