Canopy, AWS에서 기계 학습을 사용하여 재무제표 처리 자동화

2021

다양한 출처의 금융 자산을 보유한 개인의 경우, 순자산을 종합적으로 확인하려면 금융 자산을 수동으로 추적하고 집계해야 하므로 시간이 많이 소요될 수 있습니다. 이는 자산을 다양한 곳에 배분하는 경향이 있는 고액 자산가들에게는 지속적으로 문제가 됩니다.

2013년 싱가포르에서 설립된 Canopy는 이 문제를 해결하고자 나섰습니다. Canopy는 재무제표를 분석하고 관련 정보를 추출하여 단일 대시보드에 정렬함으로써 고액 자산가가 다양한 금융 자산을 단일 화면에서 볼 수 있도록 합니다. Canopy의 플랫폼을 사용하면 고액 자산가는 재무 성과, 전략, 시장 타이밍을 다른 자산가와 비교하면서 본인의 자산을 쉽게 추적할 수 있습니다.

Amazon Web Services(AWS) 클라우드 네이티브 플랫폼인 Canopy는 일상적인 작업의 상당 부분을 자동화했습니다. 하지만 여전히 수동으로 재무제표를 분석해야 했기 때문에 기계 학습(ML)과 광학 문자 인식(OCR)을 통해 이 프로세스를 자동화하여 효율성을 높이길 원했습니다.

“모든 데이터 분석에 기계 학습을 적용하는 것은 복잡한 작업입니다. Amazon SageMaker는 ML을 사용하여 텍스트와 데이터를 자동으로 추출하고 단순한 OCR을 넘어 지금까지 거의 100,000개의 재무 문서를 자동으로 처리할 수 있게 해줬습니다.”라고 Canopy 최고 기술 책임자인 Amit Gupta 씨는 말합니다.

Financial data analysis graph showing search findings. Selective focus. Horizontal composition with copy space.

AWS는 몇 달 분량의 데이터를 며칠 만에 처리할 수 있는 위치까지 기계 학습 기능을 끌어올리는 데 도움을 주었습니다. 내일 고객을 위해 처리해야 하는 재무 문서 수가 10배 증가한다고 해도 쉽게 대처할 수 있습니다. 이제 더 자유롭게 사업을 확장할 수 있으며, 그게 바로 저희가 계획하던 바입니다.”

Amit Gupta
Canopy 최고 기술 책임자

기계 학습을 통해 나아가기

처음 운영을 시작했을 때 Canopy 데이터 팀은 여러 출처에서 나오는 고객의 재무 문서를 수동으로 스캔했습니다. Canopy는 약 400개의 수탁 은행에 연결하여 애플리케이션 프로그래밍 인터페이스(API), 데이터 피드, 보고 서비스, SWIFT(국제은행간전기통신협회) 형식을 비롯한 다양한 형식으로 데이터를 수신합니다.

또한, 팀은 고객 거래 명세서를 이메일, Excel 파일, PDF(이동가능 문서형식), 스캔 이미지로 받았기 때문에 고객 데이터 분석 작업은 시간과 비용이 많이 드는 프로세스였습니다. Canopy는 프로세스를 자동화하여 미래 지향적 비즈니스를 만들기 위한 여정을 시작했습니다.

“재무제표를 처리하기 위해 매주 수백 시간을 지루하게 보냈는데, 이는 지속 가능한 비즈니스 성장 방법이 아니었습니다. 자체적으로 오픈 소스 ML 모델을 실험하기 시작했으며 1년 반 만에 고객의 재무 데이터 처리를 반자동화할 수 있었습니다.”라고 Gupta 씨는 말합니다.

얼마 지나지 않아 Canopy는 자동화 여정에서 벽에 부딪혔습니다. 팀은 매월 수신되는 재무 기록의 20%에서 새로운 정보를 인식하고 처리하기 위해 ML 모델을 지속적으로 업데이트해야 했습니다. 팀이 고객 데이터를 분석하는 데 소요하는 시간은 줄었지만, 이제 데이터 처리와 ML 모델의 데이터 품질 개선에 집중해야 했기 때문에 고객 투자와 관계 관리 시간이 줄어들었습니다.

이전 설정에서 Canopy는 사용 중인 ML 모델을 재훈련할 수 없었기 때문에 플랫폼의 가동 중지 시간을 가능한 한 최소화하기 위해 주말에도 작업했는데 이렇게 해서 재훈련 프로세스 시간을 일주일에 최대 48시간 확보할 수 있었습니다. Canopy는 이 프로세스를 간소화할 수 있는 방법에 대해 자문하고 OCR 기능을 개선하기 위해 AWS를 선택했습니다.

“ML 모델을 재훈련하는 프로세스를 완전히 자동화할 수 있는지 묻는 것으로 시작했습니다. 이를 통해 AWS의 조언이 아주 유용하다는 것이 입증되었습니다.”라고 Gupta 씨는 말합니다. “AWS 팀은 Amazon SageMaker를 통해 올바른 방향을 제시하였고, 구현 과정에서 항상 지원받을 수 있도록 안내했습니다.”

Amazon SageMaker를 통해 Canopy는 더 많은 데이터 엔지니어를 고용하는 데 투자하지 않고도 ML 모델을 효율적으로 개발하고 OCR 기능을 개선할 수 있었습니다. Canopy는 이 솔루션을 이용하여 ML 모델의 구축, 훈련, 배포를 하나의 플랫폼에서 통합할 수 있습니다. SageMaker는 재무 기록을 구문 분석하면서 새로운 정보를 발견할 때마다 ML 모델을 자동으로 업데이트합니다.

미래를 위한 준비

ML 기능을 통해 Canopy는 이제 한 달에 2,000건의 고객 재무 기록을 처리할 수 있습니다. 이를 통해 데이터 팀이 제품 혁신에 집중할 수 있으며 300%의 비즈니스 성장을 달성할 수 있었습니다. 현재 수천 명의 고객에게 서비스를 제공하고 있으며, 2021년 현재 1,200억 USD의 자산을 관리하고 있습니다.

회사는 AWS로 데이터 처리를 간소화한 덕분에 10배 증가한 사용자 수요도 충족할 수 있도록 확장할 계획입니다.

향후 Canopy는 2021년에 미국으로 사업을 확장할 계획이며 2021년 말까지 관리 자산을 두 배로 늘리는 것으로 목표를 설정했습니다. 백엔드 운영에 대한 지원을 강화하기 위해 AWS Managed Services(AMS)를 이용하여 성장 계획을 지원할 계획입니다.

AWS는 몇 달 분량의 데이터를 며칠 만에 처리할 수 있는 위치까지 ML 기능을 가져오는 데 도움을 주었습니다. 내일까지 고객을 위해 처리해야 하는 재무 문서 수가 10배 증가한다고 해도 쉽게 대처할 수 있습니다. 이제 더 자유롭게 사업을 확장할 수 있으며, 그게 바로 저희가 계획하던 바입니다.”라고 Gupta 씨는 인터뷰를 마쳤습니다.

자세히 알아보려면 다음을 참조하세요.

자세히 알아보려면 aws.amazon.com/sagemaker를 방문하세요.

Canopy 소개

2013년에 설립된 Canopy는 고액 자산가를 위한 자산 통합 플랫폼입니다. Canopy는 플랫폼의 고객 인터페이스에서 재무제표를 처리하고 관련 정보를 통합하여 고객이 자산군과 자산 시장 전반에 걸쳐 다양한 금융 자산을 단일 화면에서 볼 수 있도록 합니다. Credit Suisse를 주력 고객이자 투자자로 꼽습니다.

AWS의 이점

PDF를 API에 대규모로 디지털화 가능
사용자 수요가 10배 증가해도 대처할 수 있도록 확장 가능
하나의 플랫폼에서 기계 학습 모델들을 동시에 훈련해서 배포 가능

사용된 AWS 서비스

Amazon SageMaker

Amazon SageMaker를 통해 데이터 사이언티스트와 개발자는 기계 학습을 위해 특별히 구축된 다양한 기능 세트를 함께 활용하여 고품질 기계 학습 모형을 빠르게 준비, 구축, 훈련 및 배포할 수 있습니다.

자세히 알아보기 »

시작하기

산업 분야를 불문하고 다양한 규모의 기업들이 AWS를 통해 매일 비즈니스를 혁신하고 있습니다. 지금 전문가와 상담하고 AWS 클라우드로의 여정을 시작하세요.

영업 팀에 문의