고객 성공 사례 / 생명 과학

2022년
Vertex 로고

Vertex Pharmaceuticals는 AWS를 사용하여 Cryo-EM 데이터 스토리지 비용과 데이터 처리 비용을 50% 절감했습니다.

Vertex Pharmaceuticals가 어떻게 AWS에서 Cryo-EM 워크플로를 실행하여 신약 개발을 가속화했는지 알아보세요.

2배

성능 향상

50% 이상

비용 절감

수일

데이터 처리 시간을 수일 단축

3개월

새로운 아키텍처의 프로토타입을 3개월 만에 완성

개선

확장성 및 생산성 개선

개요

Vertex Pharmaceuticals(Vertex)는 중증 질환 환자들을 위한 혁신적인 의약품을 개발하는 것을 목표로 과학적 혁신에 투자하는 글로벌 생명 공학 기업입니다. Vertex는 극저온 전자 현미경(cryo-EM)을 사용하여 단백질의 3D 구조와 잠재적 약물 표적의 구조에 대한 정교한 이미지와 인사이트를 생성합니다. 이 과정을 통해 회사의 화학자들은 표적에 결합되도록 구조를 최적화하여 더 나은 약물 분자를 설계할 수 있습니다.
 
하지만 cryo-EM 워크플로에는 엄청난 양의 컴퓨팅 리소스와 스토리지 리소스가 필요합니다. 여러 연구 사이트에 걸쳐 분석을 수행하는 과학자들은 페타바이트 규모의 데이터를 생성합니다. Vertex는 이 같은 연구를 가속화하기에 충분한 처리 능력을 제공하는 동시에 높아지는 요구 사항을 지원할 수 있도록 인프라를 확장 가능하게 만들어야 했습니다.
 
이에 Vertex는 데이터 스토리지와 처리 리소스를 Amazon Web Services(AWS)로 마이그레이션했습니다. 이 회사는 안전하고 크기 조정이 가능한 컴퓨팅 용량을 제공하여 거의 모든 워크로드를 지원하는 Amazon Elastic Compute Cloud(Amazon EC2)를 비롯한 여러 AWS 서비스를 활용했습니다. Vertex는 고성능 컴퓨팅(HPC) 워크로드의 성능을 개선하고, 데이터 분석을 가속화하며, 시스템을 확장 가능하도록 만드는 동시에 전체 스토리지 및 컴퓨팅 비용을 50% 이상 절감했습니다.
Scientist Working on Computer In  Modern LaboratoryNOTE TO INSPECTOR: all graps, dna models, charts are made by me

기회 | Cryo-EM 워크플로의 처리 성능을 높여 인사이트를 더 빠르게 생성 

Vertex는 cryo-EM을 사용하여 잠재적 약물 표적의 분자 구조를 분석하면서 질병의 새로운 치료법을 찾아냅니다. Vertex Pharmaceuticals의 수석 연구 과학자인 David Posson은 “cryo-EM 덕분에 몇 년 전만 해도 연구가 불가능했던 단백질 구조에 대한 심층적인 인사이트를 확보하기에 충분한 해상도를 얻을 수 있게 되었습니다”라고 말합니다.
 
그런데 이 첨단 기술이 신약 발견과 새로운 치료법 개발의 가능성을 열어주었지만 그와 함께 스토리지와 컴퓨팅 용량에 대한 필요성도 커졌습니다. Vertex Pharmaceuticals의 소프트웨어 엔지니어링 부문 상임 이사인 Roberto Iturralde는 “cryo-EM용 현미경을 실행하면 매일 테라바이트 규모의 데이터가 생성됩니다. 1년이면 보통 1PB의 데이터가 생성되죠”라고 말합니다. 게다가 과학자들에게는 빠른 인사이트가 필요합니다. 기존에 cryo-EM 워크로드를 실행하던 Vertex의 온프레미스 인프라로는 빠르게 증가하는 컴퓨팅 및 스토리지 수요를 따라가기가 버거웠습니다.
 
처음에 Vertex는 하드 디스크를 사용하여 외부 시설의 현미경에서 데이터 센터로 모든 데이터를 전송해야 했는데, 이는 몇 주가 걸렸습니다. 새 데이터가 들어올 때 회사의 온프레미스 HPC 클러스터는 급증하는 작업량을 효율적으로 처리하지 못했습니다. 또한 작업량이 적은 기간에는 스케일 다운할 수 없었습니다.
 
데이터를 장기간 저장하는 것 또한 문제였습니다. 몇 주만 지나도 과학자들은 상대적으로 오래된 현미경 데이터에 거의 액세스하지 않았습니다. 하지만 Vertex의 온프레미스 환경은 사용 및 액세스 패턴에 따라 비용을 절감하도록 최적화되어 있지 않았습니다. 이 분야가 빠르게 발전함에 따라, 온프레미스에서 cryo-EM 인프라를 관리하는 과정에서 하드웨어, 소프트웨어, 네트워킹 및 보안을 지속적으로 업그레이드하는 데 소요되는 비용도 증가했습니다. 2022년 초, Vertex는 더 나은 성능을 갖춘 보다 탄력적인 솔루션이 필요하다는 것을 깨달았습니다.
 
Vertex는 2015년부터 이미 다양한 워크로드에 AWS를 사용하고 있었습니다. AWS re:Invent 2021에서 출시된 새로운 기능에 관심을 보였던 Vertex는 전체 cryo-EM 워크로드를 재설계하고 AWS로 마이그레이션했습니다. 이 회사는 단 3개월 만에 새 아키텍처의 프로토타입을 제작했습니다. Iturralde는 “AWS는 Vertex에서 원하는 가장 광범위하고 심층적인 클라우드 네이티브 기술을 보유하고 있습니다. AWS를 활용한 덕분에 날로 높아지는 과학자들의 요구 사항을 보다 효과적으로 지원할 새로운 설계로 빠르게 전환할 수 있었습니다”라고 말합니다.
kr_quotemark

AWS를 기반으로 작업하게 되면서 혁신에 더 많은 시간을 할애할 수 있게 되었습니다. 창의력을 발휘하고 클라우드를 활용하여 과학 발전을 가속화할 수 있게 되었습니다.”

Roberto Iturralde
Vertex Pharmaceuticals 소프트웨어 엔지니어링 부문 상임 이사

솔루션 | AWS ParallelCluster를 사용하여 데이터 스토리지 비용 절감 및 처리 가속화 

AWS로의 마이그레이션한 결과, Vertex는 업계 최고 수준의 확장성, 데이터 가용성, 보안 및 성능을 제공하는 객체 스토리지 서비스로서 데이터가 저장되는 Amazon Simple Storage Service(S3)의 위치에 더 가까운 리전으로 워크로드를 마이그레이션할 수 있었습니다. 또한 Vertex는 세계에서 가장 인기 있는 고성능 파일 시스템 중 하나에 구축된 완전관리형 공유 스토리지인 Amazon FSx for Lustre를 사용하여 과학자들에게 활성 분석 시에 필요한 스토리지 리소스를 정확히 제공합니다.

처리가 끝나면 Vertex는 데이터를 Amazon S3로 다시 전송합니다. 이 회사는 Amazon S3에서 일련의 객체에 적용하는 작업을 정의한 규칙 집합인 Amazon S3 수명 주기 정책을 사용하여 데이터를 효율적으로 정렬합니다. Iturralde는 “Amazon S3 수명 주기 정책을 사용하면 데이터를 여러 티어에 배치하여 스토리지 비용을 낮출 수 있습니다”라고 말합니다. 또한 이 회사는 스토리지를 원활하게 크기 조정하여 데이터 센터 오버헤드를 제한할 수 있습니다.

Vertex는 데이터 처리를 위한 컴퓨팅 리소스를 관리하는 데 오픈 소스 클러스터 관리 도구인 AWS ParallelCluster를 사용합니다. 이 도구는 AWS에서 탄력적인 HPC 클러스터를 간편하게 배포하고 관리할 수 있도록 하며, 분석 소프트웨어의 요구 사항에 따라 HPC 노드를 가동하거나 중단합니다. Iturralde는 “분석 작업이 끝나면 비용을 0에 가깝게 다시 낮출 수 있습니다. 과학의 발전 속도가 우리가 보유한 리소스를 훨씬 뛰어넘거나, 자칫 인프라 유지 관리 작업에 매몰될 걱정을 하지 않아도 됩니다”라고 말합니다.

Vertex는 컴퓨팅 비용을 워크로드 수요에 맞춰 조정함으로써 비용을 50% 절감했습니다. 또한 이전 아키텍처보다 두 배 더 나은 성능을 실현했습니다. 또한 Vertex는 cryo-EM 팀이 온프레미스 환경에서 다른 그룹과 리소스를 공유할 때 종종 발생했던 병목 현상도 해결했습니다. Posson은 “이전에는 다른 누구도 리소스를 사용하고 있지 않은 경우에도 cryo-EM 데이터를 분석하는 데 몇 주가 걸렸습니다. 이제 AWS를 사용하여 1주일 이내에 안정적으로 데이터를 확보할 수 있습니다”라고 말합니다.

Vertex는 Amazon Cognito를 사용한 네이티브 Single Sign-On 지원을 추가했습니다. 이 서비스는 기업들이 웹 및 모바일 앱에 대한 가입, 로그인 및 액세스 제어 기능을 쉽고 빠르게 추가할 수 있도록 합니다. Iturralde는 “Amazon Cognito 덕분에 적절한 직원에게만 소프트웨어 액세스 권한이 부여되어 훨씬 편해졌습니다”라고 말합니다. 아울러 Vertex는 최신 애플리케이션 제공 시에 고급 요청 라우팅 기술로 HTTP 및 HTTPS 트래픽을 로드 밸런싱하는 Application Load Balancer를 사용하여 네트워킹을 보호합니다.

AWS에서 Vertex는 유지 관리를 위한 수작업을 줄이면서 프로세스의 효율성과 확장성, 비용 효율성을 높였습니다. 또한 AWS를 기반으로 환경을 구축한 결과, 데이터 센터 하드웨어를 조달하는 데 소요되는 수개월의 리드 타임 없이 최신 컴퓨팅 리소스와 GPU 리소스를 이용할 수 있게 되었습니다. 일례로, Vertex는 CPU, 호스트 메모리 및 GPU 용량의 강력한 조합을 제공하는 Amazon EC2 G5 인스턴스를 실행하고 있습니다. 과학자들은 클라우드에서 cryo-EM 프로세스를 실행함으로써 거의 실시간으로 분석을 수행할 수 있습니다. Vertex는 값비싼 현미경 사용 시간을 더 효율적으로 사용하면서 과학 혁신을 촉진하고 있습니다.

결과 | Amazon EC2를 사용하여 데이터 처리를 가속화함으로써 연구 기간 단축 

이미 분석 결과를 얻는 데 소요되는 시간을 단축한 Vertex는 이를 더욱 가속화하기를 희망하고 있습니다. Posson은 “라이브 처리를 통해 데이터가 현미경에서 나오는 즉시 분석을 시작할 수 있습니다. 1주일이 걸리던 일정을 절반으로 줄일 수도 있습니다”라고 말합니다.
 
또한 Vertex는 비용 절감을 위해 앞으로도 꾸준히 HPC 인프라의 탄력성을 더욱 높이고 클라우드 네이티브 환경으로 만들어갈 계획입니다. Iturralde는 “AWS를 기반으로 작업하게 되면서 혁신에 더 많은 시간을 할애할 수 있게 되었습니다. 창의력을 발휘하고 클라우드를 활용하여 과학 발전을 가속화할 수 있게 되었습니다”라고 말합니다.

Vertex Pharmaceuticals 소개

Vertex는 보스턴에 본사를 둔 제약 회사로, 전 세계의 최신 현미경 기술을 활용하여 복잡한 분자를 연구하고 중증 질환의 치료법을 연구합니다.

사용된 AWS 서비스

Amazon S3

Amazon Simple Storage Service(S3)는 업계 최고 수준의 확장성, 데이터 가용성, 보안 및 성능을 제공하는 객체 스토리지 서비스입니다.

자세히 알아보기 »

Amazon EC2

Amazon Elastic Compute Cloud(Amazon EC2)는 안전하고 크기 조정이 가능한 컴퓨팅 용량을 제공하여 거의 모든 워크로드를 지원합니다.

자세히 알아보기 »

AWS ParallelCluster

AWS ParallelCluster는 AWS에서 고성능 컴퓨팅(HPC) 클러스터를 쉽게 배포하고 관리할 수 있게 해 주는 오픈 소스 클러스터 관리 도구입니다.

자세히 알아보기 »

Amazon FSx for Lustre

Amazon FSx for Lustre는 널리 사용되는 Lustre 파일 시스템의 확장성과 성능을 가진 완전관리형 공유 스토리지를 제공합니다.

자세히 알아보기 »

시작하기

모든 산업에서 다양한 규모의 조직이 AWS를 통해 매일 비즈니스를 혁신하고 임무를 수행하고 있습니다. 지금 전문가와 상담하고 AWS로의 여정을 시작하세요.