AWS에서 하루에 510억 건의 테스트를 실행하는 AstraZeneca의 유전체 데이터 처리 솔루션

2021

첫 번째 인간 유전체가 발표되고 약 20년이 지난 지금, 유전체학은 연구 중심 영역에서 개인화된 의료의 동인으로 이행하고 있습니다. 이 이행에서 글로벌 제약사인 AstraZeneca는 정밀 의료 분야에서 유전체학의 활용을 가속화하고 있으며, 게놈 분석의 발전을 통해 신약 개발에 있어 혁신을 실현하고 있습니다.

AstraZeneca는 페타바이트 단위의 유전체 염기서열 결정 데이터를 사용하여 약물 연구 및 개발에 필요한 정보를 얻습니다. 대규모 데이터를 신속하게 처리하기 위해 AstraZeneca는 Amazon Web Services(AWS)를 사용하여 영향력 있는 유전체 관련 인사이트를 빠르고 효율적으로 추출할 수 있는 솔루션을 구축했습니다.

AstraZeneca의 AWS 기반 유전체학: 페타바이트 규모 데이터에서 신약 개발의 가능성을 찾는 여정(1:19)
kr_quotemark

이러한 기능을 이용하여 2020년에 신약 개발 프로젝트에 필요한 유전자 정보를 40건 이상 확보했습니다."

Slavé Petrovski
AstraZeneca Centre for Genomics Research, R&D 유전체 분석 및 정보학 책임자 겸 부사장

혁신에 집중할 수 있도록 하는 솔루션 구축

유전체 데이터에서 빠르게 인사이트를 얻는 것에 더해 AstraZeneca는 과학적 탐구에 리소스를 재할당하고 생물정보학 작업에서 가치가 비교적 낮은 데이터 관리 활동을 수행하는 데 쓰는 시간을 없애고자 했습니다. 회사는 여러 소스에서 대규모로 페타바이트 단위의 데이터를 수집하기 때문에 강력하고 확장 가능한 컴퓨팅 용량이 필요했습니다.

이전에 AWS를 기반으로 작업을 수행했던 AstraZeneca는 AWS 도구의 사용을 확대하여 유전체 처리 및 분석 속도를 높이는 클라우드 기반 생물정보학 솔루션을 개발하기로 결정했습니다.

AWS에서 자동화를 통해 인사이트를 신속하게 확보

AstraZeneca의 고처리량 솔루션은 유전체 데이터 처리 및 분석의 많은 단계를 수행합니다. 유전체 2차 분석은 원시 염기서열 결정 판독값을 확인한 후 유전체를 재구성하고 이후 단계에서 추가 분석이 가능한 유전체 변이를 식별합니다. 이러한 단계의 데이터 오케스트레이션을 자동화하기 위해 이 아키텍처에는 서버를 프로비저닝하거나 관리할 필요 없이 코드를 실행할 수 있는 서버리스 컴퓨팅 서비스인 AWS Lambda가 사용됩니다. 또한 제출된 배치 작업의 볼륨 및 특정 리소스 요구 사항에 따라 최적의 수량 및 유형의 컴퓨팅 리소스(예: CPU 또는 메모리 최적화 인스턴스)를 동적으로 프로비저닝하는 AWS Batch를 사용하여 작업 실행 계층을 구축합니다. 그리고 객체 스토리지 서비스인 Amazon Simple Storage Service(S3)를 사용하여 버킷으로 데이터를 정렬합니다.

AWS에서 AstraZeneca는 규모, 컴퓨팅 파워 및 풍부한 기술 서비스에 대한 접근성을 활용하여 속도를 높이고 생산성을 개선했습니다. 이 회사는 필요할 때 대규모로 분석을 실행할 수 있기 때문에 분석에 필요한 데이터가 더 일찍 확보됩니다. AstraZeneca Centre for Genomics Research 유전체 분석 및 정보학 책임자 겸 부사장인 Slavé Petrovski는 “24시간 내에 510억 건 이상의 통계 테스트를 실행하여 광범위한 표현형으로 개별 돌연변이 또는 개별 유전체의 효과를 연구할 수 있다”고 말합니다. 회사의 노력은 보상을 받고 있습니다. Petrovski는 “AstraZeneca는 이러한 기능을 사용하여 2020년에 신약 개발 프로젝트에 필요한 유전자 정보를 40건 이상 확보했다"고 말합니다.

과학적 혁신 장려

AstraZeneca는 빠르고 효율적인 유전체 생물정보학 파이프라인을 만들었습니다. 과학자들은 이 파이프라인을 활용하여 혁신을 추구하는 데 시간과 리소스를 투자할 수 있습니다. Centre for Genomics Research는 2026년까지 2백만 개의 유전체를 분석하겠다는 목표를 향해 문제 없이 나아가고 있습니다.


AstraZeneca 소개

AstraZeneca는 다양한 치료 영역에서 혁신적인 의약품을 개발하는 글로벌 생물약제학 회사입니다. Centre for Genomics Research는 2026년까지 2백만 개의 유전체를 분석하는 것을 목표로 하는 AstraZeneca의 이니셔티브입니다.

AWS의 이점

  • 24시간 내에 510억 건 이상의 통계 테스트를 실행할 수 있도록 지원
  • 2020년에 40개 이상의 신약 개발 프로젝트에 필요한 유전체 관련 인사이트를 제공
  • 스케일 업 또는 스케일 다운을 통해 유전체 염기서열 결정 작업의 수요 변동을 수용
  • 과학적 탐구를 위한 리소스 확보

사용된 AWS 서비스

AWS Lambda

AWS Lambda는 서버 프로비저닝 또는 관리, 워크로드 인식 확장 로직 생성, 이벤트 통합 유지, 또는 런타임 관리 없이 코드를 실행할 수 있는 서버리스 컴퓨팅 서비스입니다.

자세히 알아보기 »

AWS Batch

AWS Batch를 사용하면 개발자, 과학자 및 엔지니어가 AWS에서 수많은 배치 컴퓨팅 작업을 효율적으로 손쉽게 실행할 수 있습니다.

자세히 알아보기 »

Amazon S3

Amazon Simple Storage Service(Amazon S3)는 업계 최고의 확장성과 데이터 가용성 및 보안과 성능을 제공하는 객체 스토리지 서비스입니다.

자세히 알아보기 »


시작하기

산업 분야를 불문하고 다양한 규모의 기업들이 AWS를 통해 매일 비즈니스를 혁신하고 있습니다. 지금 전문가와 상담하고 AWS 클라우드로의 여정을 시작하세요.