Portcast

Portcast, Amazon SageMaker를 사용하여 해상에서 기계 학습 모델 확장

2021

기계 학습(ML)으로 공급망 효율성 제고

해상 화물 운송은 전체 무역량의 90%를 차지하는 세계 무역의 주요 운송 수단입니다. 기상 상태, 통관 지연 등 여러 요인을 고려하여 항만에 상품이 언제 도착할지 예측하고 계획하는 능력은 공급망의 효율성을 크게 좌우합니다.

싱가포르에 본사를 둔 스타트업 Portcast는 기계 학습(ML) 기반 플랫폼을 통해 공급망 예측 서비스형 소프트웨어(SaaS)를 제공하여 운송 회사와 제조업체가 화물의 항만 도착 시간을 예측할 수 있도록 지원합니다. Portcast는 고객의 수작업 및 컨테이너 추적 비용을 각각 80%, 20% 절감하는 것을 목표로 합니다. 이 회사의 독점 ML 모델은 이전의 배송 및 컨테이너 이동 패턴과 기상 조건, 항만 교통량, 선박 위치 등의 실시간 데이터를 사용하여 공급망 효율성을 높입니다.

컨테이너의 실시간 위치 추적 인터페이스
kr_quotemark

Amazon SageMaker를 사용하면 효율적인 클라우드 스토리지 및 데이터 계산을 통해 예측 물류를 위한 확장형 글로벌 플랫폼을 구축할 수 있습니다."

Lingxiao Xia
Portcast 공동 창립자 겸 CTO

ML 예측을 분리하여 독립적으로 확장

Portcast는 다양한 Amazon Web Services(AWS) 서비스를 사용하여 기반 인프라와 ML 모델의 대규모 실행을 지원합니다. ML 처리를 위해 수집된 데이터를 저장하는 데에는 Amazon Relational Database Service(RDS)와 Amazon Simple Storage Service(S3)를 사용합니다. 또한 분석 작업을 지원하는 검색 로그에도 Amazon Elasticsearch Service를 사용합니다. Portcast의 공동 창립자이자 최고 기술 책임자인 Lingxiao Xia는 "AWS에서는 서비스 간의 상호 작용이 원활하게 이루어지기 때문에, 다양한 아이디어를 지속적으로 실험할 수 있습니다"라고 전했습니다.

Portcast는 2019년까지 Amazon Elastic Compute Cloud(Amazon EC2) 베어 메탈 인스턴스 및 자체 호스팅 클러스터를 사용하여 ML 모델을 훈련하고 배포했습니다. 이 접근 방식은 회사가 한 번에 수백 개의 컨테이너를 추적하던 초기에는 잘 작동했습니다. 하지만 회사가 성장함에 따라 선박 한 대당 최대 2만 개의 컨테이너를 운송하는 경우가 많았기 때문에 ML 예측이 복잡해지고 비용이 많이 들게 되었습니다. 컨테이너당 하루에 두 번씩 최신 도착 예측을 제공해야 한다는 점이 복잡성을 더욱 가중시켰습니다.

Portcast는 베어 메탈 환경에서 처리, 예측 및 엔드포인트를 비롯한 전체 ML 인프라를 일괄적으로 확장해야 했고, 이로 인해 요구 메모리 용량이 매우 커졌습니다. Portcast는 독립적으로 확장하기 위해 ML 모델에서 예측 기능을 분리해야 했습니다. 이 문제는 Amazon SageMaker를 사용해 해결했습니다.

무한한 메모리를 사용하여 병렬로 프로세스 실행

Portcast는 Amazon SageMaker 사용을 결정하기 전에 AWS 솔루션스 아키텍트와의 실습 교육 세션을 요청했습니다. Portcast의 데이터 팀은 Amazon SageMaker를 사용하여 모델 훈련을 예측 및 처리와 분리하여 ML 워크로드를 최적화했습니다. 이는 ML 모델 훈련을 수행하는 몇 가지 인스턴스로 시작됩니다. 이제 Portcast는 Amazon SageMaker를 사용하여 훈련부터 처리, 예측에 이르기까지 전체 ML 주기 내 자동화를 가속화하고 있습니다.

Xia는 "ML 모델에서 예측 기능을 분리하여 별도의 서비스로 제공함으로써 모델을 독립적으로 확장하고 메모리 요구 사항을 줄일 수 있습니다"라고 전했습니다.

이전에 Portcast는 각 모델을 메모리에 로드해야 했기 때문에 병렬로 실행할 수 있는 프로세스 수에 따라 사용이 제한되었습니다. Xia는 "모든 모델이 Amazon SageMaker에서 호스팅되므로, 메모리 한도 없이 수백 개의 프로세스를 병렬로 실행할 수 있습니다. 이제 하루에 수백만 개의 예측을 생성할 수 있습니다"라고 덧붙였습니다. 또한 Portcast는 Amazon SageMaker의 다중 모델 엔드포인트 기능을 활용하여 각 인스턴스에서 여러 모델을 호스팅함으로써 비용을 절감하고 ML 배포 비용을 60% 이상 절감합니다.

배포 가속화 및 모니터링 자동화

현재 Portcast는 하루에 수만 개의 컨테이너를 모니터링하며, 이는 이전 인프라에서는 기술적으로 불가능한 규모입니다. Xia는 "Amazon SageMaker를 사용하면 효율적인 클라우드 스토리지 및 데이터 계산을 통해 예측 물류를 위한 확장형 글로벌 플랫폼을 구축할 수 있습니다"라고 전했습니다.

완전관리형 서비스인 Amazon SageMaker는 ML 모델을 훈련하고 실행하는 기본 인프라를 담당하므로 Portcast는 초기 설정만 결정하면 됩니다. ML 모델은 자동으로 확장되며, Amazon CloudWatch는 이상이 감지되면 알림을 보냅니다. Portcast의 데이터 팀은 수작업 없이 처리 작업과 작업 상태를 손쉽게 파악할 수 있는 사용자 인터페이스를 갖추고 있습니다. 이를 통해 팀은 이전에 인프라 모니터링에 허비했던 주당 최소 2~3시간의 작업 시간을 줄일 수 있습니다.

Xia는 시간 절약 외에도 컨텍스트 전환을 줄이는 데 따른 이점도 강조합니다. 이와 관련해 그는 "데이터 사이언티스트가 모델을 분석하던 방식에서 작업을 모니터링하는 방식으로 전환해야 한다면, 컨텍스트 전환 비용이 해당 작업에 소요되는 시간보다 더 클 것입니다"라고 설명했습니다.

데이터 과학/개발 워크플로 개선

Amazon SageMaker의 도입으로 Portcast의 데이터 과학 및 개발 팀 간의 의존도 역시 낮아졌습니다. 개발자는 데이터 팀이 ML 모델을 업데이트하거나 새로운 기능을 추가하기 전에 더 이상 인프라를 설치할 필요가 없습니다. 데이터 사이언티스트는 Amazon SageMaker 내에서 작업에 필요한 인프라를 독립적으로 구축할 수 있습니다.

Amazon SageMaker에 익숙한 일부 데이터 사이언티스트는 내부 문제를 처리해줄 해결사가 되었습니다. 이들은 정기적으로 프로젝트를 제안하거나 시작하여 처리 병목 현상과 같은 일반적인 문제를 해결하는 데 도움을 줍니다. 또한 데이터 팀은 비용을 관리하면서 시스템을 확장하는 최적화 전략과 관련해 AWS 솔루션스 아키텍트와 맞춤형 세션 및 토론을 하고 Amazon SageMaker 관련 지식을 적극적으로 배워나갈 수 있습니다.

비즈니스 확대를 지원하도록 확장

Portcast의 공동 창립자이자 최고 경영자인 Nidhi Gupta는 앞으로 진정한 물류 혁신이 실현될 것이라고 판단했습니다. 이에 대해 "향후 몇 년은 우리 산업의 변곡점일 뿐이며, 앞으로 몇 달 동안 10~20배의 성장을 기대할 수 있습니다. Amazon SageMaker를 사용하면 비즈니스가 성장함에 따라 동일한 플랫폼에서 더 많은 컨테이너를 처리할 수 있습니다. 따라서 리소스를 최적화하면서 더 많은 비즈니스 기회를 모색할 수 있으며, 결과적으로 수익이 개선됩니다"라고 전했습니다.

자세히 알아보기

자세히 알아보려면 AWS의 기계 학습을 참조하세요.


Portcast 소개

Portcast는 물류 회사와 제조업체에 예측 가시성 및 수요 예측 기술을 제공합니다. Portcast의 고객은 수작업을 통한 계획을 최대 80%까지 줄이고, 화물 수요와 도착 시간을 보다 정확하게 판단하여 비용을 관리할 수 있습니다.

AWS의 이점

  • 메모리 한도 없이 수백 개의 ML 프로세스를 병렬로 실행
  • 인프라 모니터링 시간을 주당 최소 2~3시간 절감
  • 2년 만에 추적 대상 컨테이너 규모를 수백 개에서 수천 개로 확장
  • ML 배포 비용 60% 이상 절감
  • 개발자 및 데이터 과학 팀 간의 상호 의존도 감소
  • 셀프 서비스 문화를 증진하여 내부 병목 현상 해결

사용된 AWS 서비스

Amazon SageMaker

Amazon SageMaker를 통해 데이터 사이언티스트와 개발자는 기계 학습을 위해 특별히 구축된 다양한 기능 세트를 함께 활용하여 고품질 기계 학습 모형을 빠르게 준비, 구축, 훈련 및 배포할 수 있습니다.

자세히 알아보기 »

Amazon CloudWatch

Amazon CloudWatch는 DevOps 엔지니어, 개발자, SRE(사이트 안정성 엔지니어) 및 IT 관리자를 위해 구축된 모니터링 및 관찰 기능 서비스입니다.

자세히 알아보기 »

Amazon Relational Database Service(Amazon RDS)

Amazon Relational Database Service(Amazon RDS)를 사용하면 클라우드에서 관계형 데이터베이스를 간편하게 설정, 운영 및 확장할 수 있습니다.

자세히 알아보기 »

Amazon Elasticsearch Service

Amazon Elasticsearch Service는 손쉽게 Elasticsearch를 배포, 보호, 실행할 수 있는 완전관리형 서비스로 규모에 따라 효율적으로 비용을 지불할 수 있습니다.

자세히 알아보기 »


시작하기

산업 분야를 불문하고 다양한 규모의 기업들이 AWS를 통해 매일 비즈니스를 혁신하고 있습니다. 지금 전문가와 상담하고 AWS 클라우드로의 여정을 시작하세요.