AWS 기술 블로그

AWS ParallelCluster와 Amazon SageMaker를 이용한 바이옴에이츠의 미생물 복합 균주 개발 사례

바이옴에이츠(BIOMATZ)는 2022년 4월에 설립된 마이크로바이옴 복합 균주 설루션 개발사로, “Biome is our mates”라는 철학을 갖고 있으며, 마이크로바이옴 의약품 연구 개발 분야의 대표적인 스타트업 기업입니다. 수천 개의 균 사이의 상호작용을 분석하여 최적의 ‘메이트(Mates)’를 조합하는 AI 기술인 BASyMCo를 보유하고 있습니다. 당사는 장내미생물 빅데이터를 활용하여 마이크로바이옴 복합 균주 치료제 개발에 전념하고 있습니다.

[영상] 바이옴에이츠 기업 소개 | Biome is our mates, BIOMATZ

배경

바이옴에이츠의 목표는 다양한 질병을 치료할 수 있는 혁신적인 복합 균주 치료제를 개발하는 것입니다. 복합 균주 치료제는 서로 다른 미생물 간의 시너지 효과를 이용하여 치료 효과를 극대화하는 방법입니다. 이러한 치료제를 개발하기 위해서는 미생물의 복잡한 생태계를 고려한 Shotgun Metagenomic Sequencing과 같은 고도화된 유전자 분석 기법이 필요합니다.

Shotgun Metagenomic Sequencing이란, 환경에서 채취한 미생물 샘플의 모든 유전자를 분석하는 기술입니다. 이 작업은 샘플 수집 – DNA 추출 – DNA 분해 – 시퀀싱 – 데이터 조립과 같은 일련의 과정이 순차적으로 수행되어야 합니다. 채취한 환경 샘플에는 존재하는 수천에서 수만 종의 미생물이 존재하며, 그 미생물들의 DNA를 다시 작은 조각들로 나누고, 각각의 조각을 시퀀싱 하므로 하나의 미생물 샘플에서만 수십 기가바이트(GB) 이상의 데이터가 발생할 수 있습니다. 또한 각 조각을 원래의 유전체로 재구성하기 위해서는 복잡한 알고리즘과 많은 연산이 필요합니다. 따라서 이 과정을 처리하기 위해서는 대용량 데이터를 처리하고 분석하기 위한 고성능 컴퓨팅(HPC) 시스템이 필수적입니다.

당면 과제

바이옴에이츠는 복합 균주 치료제 개발 과정에서 다음과 같은 네 가지 주요 과제에 직면했습니다:

  1. 작업 프로세스 관리: 복잡한 데이터 분석 파이프라인을 효율적으로 관리하고 자동화할 필요성
  2. 유연한 컴퓨팅 자원 확보: 데이터양과 분석 요구에 따라 유연하게 확장 가능한 컴퓨팅 자원이 필요
  3. 분석환경의 일관성 관리: 다양한 분석 단계에서 일관된 환경을 유지하고, 재현 가능한 결과를 보장
  4. 비용 최적화: 컴퓨팅 자원과 스토리지 사용을 최적화하여 비용 효율성을 높임

해결 방안

바이옴에이츠는 AWS ParallelCluster와 Amazon SageMaker를 활용하여 이러한 문제를 해결했습니다.


1. 작업 프로세스 관리

바이옴에이츠는 AWS ParallelCluster를 사용하여 복잡한 데이터 분석 파이프라인을 관리했습니다. 이를 통해 작업 프로세스를 자동화하고, 분석 단계마다 필요한 스크립트와 도구를 일관되게 실행할 수 있었습니다. AWS ParallelCluster는 Slurm와 같은 스케줄러를 지원하여 작업을 효율적으로 관리할 수 있게 해줍니다.

2. 유연한 컴퓨팅 자원 확보

AWS ParallelCluster는 리소스 스케줄링과 자동 스케일링 기능을 제공합니다. 이를 통해 바이옴에이츠는 데이터양과 분석 요구에 따라 컴퓨팅 자원을 유연하게 확장하거나 축소할 수 있었습니다. 예를 들어, Shotgun Metagenomic Sequencing 데이터를 처리할 때, AWS ParallelCluster는 수백 개의 인스턴스를 병렬로 실행하여 대규모 데이터를 신속하게 처리할 수 있었습니다. 또한 자동 스케일링 기능을 활용하여 필요한 컴퓨팅 성능을 확보하면서 동시에 리소스 비용을 절약할 수 있었습니다.

3. 분석환경의 일관성 관리

AWS ParallelCluster와 Amazon SageMaker를 사용하여 일관된 분석 환경을 유지할 수 있었습니다. 각 컴퓨트 노드는 동일한 설정과 환경을 유지하며, 분석 결과의 재현성을 보장합니다. 특히, Amazon SageMaker를 통해 데이터 전처리, 모델 훈련, 하이퍼파라미터 튜닝, 모델 배포까지 일관된 환경에서 수행할 수 있었습니다. 또한, Amazon S3와 Amazon Elastic File System(EFS) 와 같은 다양한 스토리지 서비스를 활용하여 대용량 데이터를 쉽게 공유하며 저렴하게 저장하고 관리할 수 있었습니다.

4. 비용 최적화

AWS의 자동 스케일링 기능을 통해 필요할 때만 컴퓨팅 자원을 사용하여 비용을 절감할 수 있었습니다. 또한 Amazon SageMaker Autopilot을 사용하면, HPC를 통한 샷건 분석 결과 데이터와 대사체 상호작용 시뮬레이션 결과 데이터 결과로부터 다양한 알고리즘을 자동으로 탐색하고 최적의 모델을 쉽게 개발할 수 있었습니다. 이렇게 개발한 모델을 사용하면 기존에 48시간 이상 실험적으로 측정하지 않고도 예측할 수 있어 시간과 비용을 크게 절약할 수 있었습니다.

성과

AWS ParallelCluster와 Amazon SageMaker를 도입한 결과, 바이옴에이츠는 미생물 유전체 데이터의 처리 및 분석 시간을 크게 단축할 수 있었습니다. 기존에는 하나의 샘플을 분석하는 데 36시간이 소요되었으나, AWS HPC 설루션을 통해 평균 9시간으로 단축되었습니다. 또한, 복합 균주 치료제 개발에 있어 정확도와 효율성을 크게 향상시켰습니다.
바이옴에이츠는 이러한 기술적 진보를 바탕으로 다양한 파이프라인과 제품군을 확장하고 있으며, 스마트팜 설루션 개발 및 건강 기능식품 개발 등에도 기여하고 있습니다. 앞으로도 AWS의 다양한 클라우드 서비스를 적극 활용하여 글로벌 시장에서의 경쟁력을 강화할 계획입니다.

마무리

본 글에서는 AWS ParallelCluster와 Amazon SageMaker를 활용하여 바이옴에이츠의 미생물 복합 균주 설계 과정에서 직면한 주요 과제들을 어떻게 해결했는지 소개하였습니다. 바이옴에이츠는 AWS 클라우드 서비스를 통해 복잡한 데이터 분석 작업을 효율적으로 관리하고, 유연한 컴퓨팅 자원를 확보하며, 일관된 분석 환경을 유지하면서 비용 효율성을 극대화할 수 있었습니다. 이를 통해 미생물 유전체 데이터의 처리 속도를 크게 향상시키고, 복합 균주 치료제 개발의 정확도와 효율성을 높일 수 있었습니다.

AWS 클라우드 서비스를 도입함으로써 바이옴에이츠는 연구 개발의 효율성을 높이고 글로벌 시장에서 경쟁력을 강화할 수 있는 기반을 마련했습니다. 앞으로도 바이옴에이츠는 AWS 클라우드의 발전과 함께 지속적인 혁신을 통해 더 나은 치료제를 개발하고 인류 건강 증진에 기여할 것입니다. AWS 서비스의 다양한 기능과 유연성을 활용한 바이옴에이츠의 성공 사례가 다른 기업에도 참고가 되기를 바랍니다.

이름

HyunSu Kim

Biomatz의 바이오인포매틱스(BI) 연구원으로서, 미생물 유전체 데이터를 기반으로 한 분석 연구를 수행하고 있습니다. AWS 클라우드 기반 서비스를 활용하여 미생물 실험 데이터를 분석하고, 이를 통해 Biomatz의 통합 플랫폼인 ‘BASyMCo’의 주요 데이터를 생성합니다. 이러한 데이터를 활용하여 자사의 AI 기반의 복합 균주 치료제 개발에 기여하고 있습니다.

이름

Hyorim Lee

Biomatz의 바이오인포매틱스(BI) 연구원으로서, 미생물 데이터를 분석하고 자사의 복합 균주 추천 모델을 개발하는 일을 담당하고 있습니다. 또한, Biomatz의 통합 플랫폼인 ‘BASyMCo’의 주요 기능을 개발하여, 사용자가 미생물 관련 데이터를 쉽고 간편하게 제공받을 수 있도록 노력하고 있습니다.

이름

BeomSoo Oh

Biomatz의 바이오인포매틱스(BI) 개발자로서, Biomatz ‘BASyMCo’ 및 기타 사내 시스템 개발을 담당하고 있습니다. 또한 DevOps 및 네트워크 인프라 구축 및 관리를 하고 있습니다.

JinHyeok Lee

JinHyeok Lee

이진혁 솔루션즈 아키텍트는 솔루션 개발 및 보안 프로젝트 경험을 통해 스타트업 고객들이 안전하게 워크로드를 설계하고 운영할 수 있도록 지원하는 일을 담당하고 있습니다.

Chaewoong Lim

Chaewoong Lim

스타트업 고객사가 AWS Startup을 통해 신속하게 비즈니스를 구축하고 확장할 수 있도록 돕는 것이 제 역할입니다. 스타트업의 독특한 니즈와 요구사항을 파악하여 이에 맞는 AWS 서비스와 아키텍처를 제안하고, 비지니스가 성공할 수 있도록 자문과 지원을 제공하고 있습니다.