제노플랜, AWS로 아시아 지역 대표 유전자 검사 서비스 우뚝 설 기틀 마련

Genoplan

The Challenge

생명 공학(BT)과 정보 기술(IT)의 조화는 유전자 연구 분야에 큰 전기를 마련하고 있습니다. 제노플랜은 누구나 자신의 유전자 정보에 접근하고, 활용할 수 있는 세상을 만들겠다는 목표로 2015년 설립된 회사입니다. 제노플랜은 창업 초기부터 관심을 받았습니다. 생명 공학 분야 R&D 전문가와 데이터 과학자 및 IT 전문가로 구성된 조직의 역량과 아시아 지역을 대표하는 유전자 분석 서비스 기업이 되겠다는 이들의 목표에 시장이 주목한 것입니다.

제노플랜은 사업 초기 B2B2C 분야에 집중했습니다. 남다른 유전자 분석 역량을 바탕으로 제약사, 보험사 등 기업 고객이 요구하는 유전자 키트를 개발해 공급해왔습니다. 이 과정에서 제노플랜은 시장과 소비자가 원하는 것이 무엇인지에 대한 통찰력을 얻었습니다. 이를 바탕으로 제노플랜은 유전자 검사 키트를 직접 개인 소비자에게 판매할 수 있는 플랫폼으로 B2C 부문까지 비즈니스 확장을 준비 중에 있습니다.

제노플랜의 유전자 검사 서비스는 지금껏 대한민국에 없던 간편한 서비스입니다. 이용자는 키트를 구매해, 여기에 본인의 침(타액)을 담아 택배로 보내기만 하면 됩니다. 연구소에는 택배를 받아 키트에서 DNA를 추출하고, 건강에 관여하는 유전자형을 확인해 보고서로 만들어 이용자에게 영업일 기준으로 10일 이내에 보냅니다.

겉으로 보기에 매우 편하고 간단해 보이지만, 이를 플랫폼으로 구현하는 것은 매우 어렵습니다. 제노플랜 역시 이를 잘 알았습니다. B2B2C 사업을 주로 할 때는 연구소 내에 서버, 스토리지 등 IT 환경을 구축해 운영했습니다. 이 때만 해도 실험 결과 데이터를 사람의 눈으로 확인했습니다. B2B2C는 이게 가능하지만 수많은 개인 고객이 보내오는 많은 양의 키트에 담긴 DNA 실험 데이터를 매뉴얼 방식으로 검증하면 너무 긴 시간이 소요됩니다. 이런 이유로 제노플랜은 실험 데이터 관련 데이터 파이프라인을 정비하는 한편 기존 레거시 환경을 클라우드로 이전하기로 합니다.

관련해 제노플랜 백엔드SW 개발팀 김범진 팀장은 “사내 구축한 IT 환경은 아무래도 처리량에 한계가 있고, 확장이 쉽지 않았습니다. 데이터 처리량은 점점 많아지는데 B2B2C를 넘어 B2C 서비스를 본격적으로 제공하려면 클라우드로 가야만 했습니다.”라고 말했습니다.

"우리는 AWS 환경에서 DNA 실험 데이터 검증 과정에서 수작업을 크게 줄였습니다. 이를 통해 영업일 기준 10일 이내 검사 결과를 전달한다는 소비자와의 약속에 충실할 수 있게 되었고, 검사 키트 분석 요청이 한꺼번에 몰려와도 AWS가 제공하는 무제한에 가까운 확장성을 통해 10일 이내 결과 보고서를 보낼 수 있습니다."

제노플랜 강병규 대표

  • Genoplan 정보
  • 이점
  • 사용된 AWS 서비스
  • Genoplan 정보
  • 제노플랜은 BT와 IT 기술로 유전자 분석 관련 상품과 서비스를 제공하는 기업으로 간편한 방법으로 개인의 유전적 성향을 알려주며 식이, 운동, 습관 등 다양한 영역에 대한 팁과 유전적 특성에 접합한 제품을 추천합니다. 그리고 기업에게는 개인 맞춤형 헬스케어 관련 상품과 서비스를 계획할 수 있도록 도와 줍니다. 유전자 빅 데이터를 분석하고보고서로 만들어 줍니다.  

  • 이점
    • 누구나 자신의 유전자 정보에 접근하고 활용할 수 있는 서비스 출시 속도 가속
    • 유전자 정보 분석 속도 높여, 고객 만족 강화
    • 아시아 시장 확대를 위한 교두보 마련  
  • 사용된 AWS 서비스

Why Amazon Web Services

제노플랜은 기존에 구축한 실험 데이터 분석 시스템 환경과의 연계성을 고려해 AWS를 선택했습니다. 제노플랜은 기존 시스템을 그대로 옮기기보다 구조를 거의 다 바꾸는 방식으로 전환을 했습니다. B2C까지 소화하려면 클라우드 네이티브한 아키텍처가 장기적으로 옳다고 보고 논리적으로는 이전이지만 실제로는 다시 구축하는 방식으로 간 것입니다.

제노플랜은 B2C 서비스를 위한 웹 서비스 구현과 함께 연구소에 운영하는 레거시와 클라우드를 잇는 데이터 파이프라인 설계를 하였습니다. 이중 데이터 파이프라인 설계는 B2C 서비스에 대한 소비자의 가장 큰 기대인 가능한 빨리 보고서를 받아 보고 싶다는 것을 충족하는 데 있어 매우 중요한 요소였습니다. 서구 지역 선도 유전자 기업들의 서비스 수준인 영업일 기준 10일 이내 보고서를 전달하려면 실험 데이터 분석을 매우 빨리해야 합니다.

관련해 제노플랜 데이터 과학팀 안충현 팀장은 “우리가 분석하는 유전자 수가 70만 개가 넘다 보니 하나하나 눈으로 보며 검증을 하려면 시간 제약이 너무 큽니다. 그래서 시간 단축을 목표로 검증 과정의 일부를 알고리즘으로 자동화하고, 이상이 있는 것만 연구원이 매뉴얼 방식으로 검사할 수 있는 방향으로 데이터 파이프라인을 짰습니다.”라고 말했습니다.

DNA 실험 데이터 검증 시간 단축을 목표로 삼은 제노플랜은 서버리스 환경으로 데이터 처리 환경을 구축했습니다. 빠르게 증가하는 데이터를 안정적으로 저장하기 위해 제약없이 쉽게 확장가능한 데이터베이스가 필요하다고 판단한 제노플랜은 조회 속도 측면에서 실험 데이터 처리에 강점이 있는 Amazon DynamoDB를 선택했으며, AWS Lambda, AWS Step Functions, AWS Batch 를 적용해 자동화 기반의 파이프라인을 완성했습니다. 그리고 향후 급속도로 증가할 데이터를 처리하기 위하여 데이터 레이크 방식의 처리를 고려하고 있습니다.

간단히 보자면 실험 데이터가 생성되면, 이 정보는 Amazon S3에 올라가고, 저장되는 순간 트리거를 통해 파이프라인이 가동됩니다. 실험 데이터 검증은 알고리즘 기반으로 자동화되며, 이상 정보만 사람이 맨눈으로 확인을 합니다. 최종 데이터가 나오면 변환 과정을 거쳐 Amazon DynamoDB에 입력됩니다. 이 모든 과정이 서버리스 환경에서 AWS Lambda와 AWS Step Functions, AWS Batch 를 통해 프로세스가 진행되는 것입니다. 이 흐름은 경제적이며 실용적입니다. 유전자 검사 의뢰가 많으면 AWS Lambda로 신속히 자원을 늘려 Amazon SNS로 자동화된 프로세스를 동시에 처리하면 됩니다. 검사 의뢰가 적을 때는 당연히 자원을 줄이면 됩니다.

한편 웹 서비스 부문의 경우 가용성과 보안성 강화에 초점을 맞추었습니다. 관련해 김범진 팀장은 “처음에는 간단한 구조로 웹 서비스를 구축했는데, 고가용성과 보안 보장에 있어 잠재적인 문제가 있었습니다. 그래서 설치형으로 구축했던 데이터베이스를 Amazon RDS로 바꾸었고, 다음 과제로 아시아 시장 확대에 발맞춰 CDN 서비스와 웹 방화벽 도입을 검토 중입니다.”라고 말했습니다.

The Benefits

제노플랜의 B2C 서비스는 시장의 큰 관심 속에 성장해 나아가고 있습니다. 관련해 제노플랜 강병규 대표는 “2019년 마이크로 어레이 시퀀싱을 도입하면서 본격적으로 개인 고객에게 서비스를 시작했고, 월 20% 이상 성장하고 있습니다. 서구 지역 선도 기업들은 백인의 DNA에 대한 데이터베이스만 가지고 있습니다. 제노플랜은 아시아인을 위한 칩 개발과 분석에 주력할 것이며 이를 위해 한국을 넘어 일본, 싱가포르, 동남아시아 등에 적극적으로 진출할 것입니다. 사업 특성상 이용자가 많아질수록 데이터 양이 비례해서 늘어나는데, AWS를 통해 안정적으로 사업을 확장해 나갈 수 있을 것으로 기대합니다. 또한, 종량제로 클라우드를 쓰기 때문에 사업 무대를 확대하는 데 필요한 비용도 투명하게 예측할 수 있어 경영 계획 수립에도 도움이 될 것으로 봅니다.”라고 말했습니다.

제노플랜의 핵심 경쟁력 중 하나인 데이터 과학 역량과 관련해 기계학습의 기여를 빼놓을 수 없습니다. 안충현 팀장은 “우리는 두 가지 측면에서 데이터를 다룹니다. 하나는 순수하게 수집한 연구 목적의 데이터 분석입니다. 다른 하나는 실험 프로세스에서 오류를 찾아내거나 미연에 방지하는 것입니다. 이를 위해 머신 러닝을 통한 데이터 분석 모델을 확립하기까지는 많은 시행착오를 거쳐야 하는데, 이 모든 과정을 클라우드에서 진행하기에는 비용이 부담이 되었습니다.

부담을 줄이기 위하여 모델 구축을 위한 테스트와 구축된 모델의 시험은 사내의 GPU 서버를 통하여 진행 중이고, 완성된 분석 모델을 배포하기 위해서는 완전 관리형 서비스인 Amazon SageMaker를 이용할 계획입니다.”라고 말했습니다.

한편 제노플랜은 AWS 같은 클라우드 서비스가 풀 시퀀싱 시대를 앞당기는 촉매가 될 것으로 전망하고 있습니다. 관련해 강병규 대표는 “90년대만 해도 한 사람의 전체 유전체를 분석하는 데 10년간 1,000억 원이 들었습니다. 지금은 30억 개의 염기 서열을 분석하는 풀 시퀀싱 비용이 몇 십만 원 대로 떨어졌습니다. 앞으로 이 비용은 클라우드 기술 발전으로 인해 더 떨어질 것입니다.”라고 말했습니다. 그는 또한 “우리는 AWS 환경에서 DNA 실험 데이터 검증 과정에서 수작업을 크게 줄였습니다. 이를 통해 영업일 기준 10일 이내 검사 결과를 전달한다는 소비자와의 약속에 충실할 수 있게 되었고, 검사 키트 분석 요청이 한꺼번에 몰려와도 AWS가 제공하는 무제한에 가까운 확장성을 통해 10일 이내 결과 보고서를 보낼 수 있습니다.”라고 덧붙여 설명했습니다.


자세히 알아보기

더 자세한 내용은 http://aws.amazon.com에서 확인하실 수 있습니다.