Careem 로고

Careem, AWS 기계 학습으로 사기 방지 강화

2021년

두바이에 본사를 둔 Careem은 2019년 Uber에 31억 달러에 인수되면서 중동 최초의 유니콘 기업이 되었습니다. 지역 차량 호출 경제의 선구자인 Careem은 이제 대중교통, 배달, 결제까지 서비스를 확장하며 일상생활의 슈퍼 앱으로 성장하고 있습니다.

그러나 약 5,000만 개의 고객 계정을 보유한 Careem은 그 규모와 인기로 인해 끊임없이 새로운 허점을 찾아내 악용하고 진짜 계정을 탈취할 다양한 방법을 찾는 사기꾼들의 주요 표적이 되었습니다.

Careem은 매출과 브랜드 평판을 모두 훼손하는 사기로 인한 손실을 탐지하고 차단할 방법이 필요했습니다.

그래서 Amazon Web Services(AWS)로 전환하였고, 이제는 분석과 기계 학습을 사용하여 범죄가 일어나기 전에 사기꾼을 자동으로 식별하고 차단하여 이에 대응하고 있습니다.

Careem 배달
kr_quotemark

Amazon Neptune은 완전관리형이라서 이 프로젝트에 필요한 인력 규모와 인프라 및 유지 관리에 드는 잠재적 비용 측면에서 큰 이점입니다.”

Kevin O’Brien
Careem 선임 데이터 과학자

사기꾼의 공격 시점

Careem은 다양한 유형의 사기를 경험하고 있으며, 범죄자들은 기존의 사기 패턴을 방지하기 위해 마련한 특정 조치를 우회하기 위해 항상 새로운 허점을 찾습니다.

과거에 이러한 여러 유형의 사기에 맞서는 일은 마치 영원히 끝나지 않는 숨바꼭질처럼 이어졌습니다. Careem은 특정 사기 유형별로 규칙이나 기계 학습 모델을 만들어야 했습니다. 하지만 이는 두 가지 측면에서 문제가 있었습니다.

첫째, 사기 행위가 일어나고 탐지된 후에야 Careem이 계정을 식별하고 차단할 수 있었기 때문에 금전적인 손실은 이미 발생한 뒤였습니다.

둘째, 사기꾼들은 Careem이 이러한 유형의 사기를 탐지하는 방법을 언제 알아냈는지 빠르게 알아차릴 수 있었고, 악용할 새로운 허점을 찾아냈습니다.

더 스마트한 방법

Careem에게는 사기 계정을 탐지하고 사기가 발생하기 전에 이를 방지할 수 있는 더 스마트하고 빠른 방법이 필요하다는 사실이 분명했습니다.

Careem의 선임 데이터 과학자인 Kevin O'Brien은 “매우 특정한 사기 사용 사례를 탐지하기 위한 매우 특정한 도구를 지속적으로 개발하는 대신, 사기꾼들이 어떤 유형의 허점을 발견했든, 어떤 유형의 공격을 시도하든 모든 사용자를 대상으로 거의 포괄적인 탐지 메커니즘을 제공하는 프로젝트를 구축하고자 했습니다”라고 말합니다.

Careem은 사용자 및 계정 활동 전반에서 잠재적인 사기 패턴을 실시간으로 탐지하는 방법으로 그래프 데이터베이스를 선택했고, 시장의 주요 제공업체 몇 곳을 평가했습니다. 

Careem은 AWS와 자동화된 실시간 분석 및 모니터링 기능을 지닌 Amazon Neptune을 선택했으며, 그 이유 중 하나는 관리형 서비스이기 때문입니다. 

“Amazon Neptune은 완전관리형이라서 이 프로젝트에 필요한 인력 규모와 인프라 및 유지 관리에 드는 잠재적 비용 측면에서 큰 이점입니다. 게다가 AWS에서 이 모든 것을 완벽하게 관리합니다”라고 O’Brien은 말합니다. 

Careem은 이미 모든 클라우드 컴퓨팅 및 데이터 웨어하우스 운영에 AWS를 사용하고 있었기 때문에 사기 방지 프로젝트에서도 동일한 환경을 유지하기로 결정했습니다. 

또한, 다른 그래프 데이터베이스 제공업체가 사용하는 Cypher와 같은 쿼리 언어보다 Amazon Neptune을 지원하는 Gremlin 쿼리 언어를 선호했습니다. Gremlin을 사용하면 개발자가 Groovy, Java, Python을 비롯한 다양한 프로그래밍 언어로 쿼리를 작성할 수 있습니다.

신원에 초점을 맞춰 패턴 감지

Amazon Neptune을 사용하여 사기 탐지 기능을 개선하기 위해 Careem은 특정 유형의 사기가 발생했을 때 이를 해결하기 위한 노력과 더불어 사용자의 신원에 초점을 맞추기 시작했습니다.

Careem은 Amazon Neptune 그래프 데이터베이스를 사용하여 여러 사용자와 데이터 포인트를 연결하고 사기 활동을 나타낼 수 있는 패턴을 식별할 수 있게 되었습니다.

사기 방지 프로젝트의 첫 번째 버전은 2020년 10월에 시작되었는데, 데이터 웨어하우스와 같은 Careem의 사내 소스에서 가져온 2012년부터의 과거 사용자 데이터를 사용하였습니다. 이 데이터는 추출 및 변환된 후 Amazon Simple Storage Service(S3)에서 CSV 파일로 포맷되어 Amazon Neptune에 업로드됩니다. 사용자가 새 디바이스를 사용하여 로그인하거나, 새 신용 카드를 추가하거나, 전화번호를 변경하거나, 프로필을 변경하는 등 새로운 작업을 수행할 때 이 기록 데이터가 실시간으로 추가됩니다. Amazon Neptune 그래프에 데이터가 추가되거나 업데이트되는 횟수는 평균적으로 하루에 100,000회 이상입니다.

이렇게 하면 각 사용자와 연결된 데이터 클러스터가 생성됩니다. 이 클러스터는 Careem이 Python을 사용하여 구축한 간단한 알고리즘 분석 엔진을 사용하여 분석되고 이 엔진은 Amazon Neptune 위에 위치해 있습니다. 

사기 가능성이 있는 것으로 분류된 계정은 데이터에 따라 이전에 신뢰할 수 없는 계정이었던 경우 자동으로 차단되고, 신뢰할 수 있는 계정이거나 가치가 높은 계정(예: 기업 고객 계정)인 경우 수동 검토 대상으로 분류됩니다.

정확도 향상으로 손실 감소

Careem은 2020년 10월 프로젝트의 첫 번째 단계를 구현한 이후 수만 개의 사기 사용자 계정을 차단했으며, 시스템이 자동으로 차단한 사용자의 약 90%가 올바른 결정이었다는 놀라운 결과를 얻었습니다. 즉, Careem은 사기가 발생하기 전에 이러한 가짜 계정을 차단했고, 이는 손실을 줄이는 데 도움이 되었습니다.

프로젝트의 첫 단계를 성공적으로 완료한 후 Careem은 현재 Amazon Neptune ML의 기계 학습 기능을 사용하여 정확도를 더욱 개선할 업데이트 버전을 AWS와 함께 개발하고 있습니다.

Careem은 이제 약 10배 더 많은 과거 데이터를 사용하여 단순한 규칙 기반 접근 방식 대신 고급 딥 러닝을 적용하고 그래프 데이터베이스에서 사기 사용자의 모습을 식별하는 방법을 학습할 수 있도록 시스템을 훈련할 수 있을 것입니다. 그러면 시스템에서 분석한 모든 사용자 중에서 더 많은 사기 계정을 정확하게 찾아내는 동시에 사기 예측 정확도를 90% 이상으로 높일 수 있어 리콜이 크게 개선될 것입니다.

O’Brien은 “이번 두 번째 버전의 솔루션이 현재의 사기 방지 기능을 개선할 것이라고 확신합니다. 그리고 이것이 우리가 Amazon Neptune을 선택한 또 다른 주요 이유입니다”라고 말합니다.


Careem 소개

두바이에 본사를 둔 Careem은 차량 호출 경제의 선구자이며 현재 대중교통, 배달, 결제까지 서비스를 확장하고 있습니다. 2012년에 설립된 Careem은 중동, 아프리카, 남아시아의 14개국 100개 이상의 도시에서 사업을 운영하고 있습니다. 2019년에는 Uber가 31억 달러에 인수했습니다.

AWS의 이점

  • 보안 및 규정 준수
  • 민첩성 및 성능
  • 가용성
  • 혁신

사용된 AWS 서비스

Amazon Neptune

Amazon Neptune은 빠르고 안정적인 완전관리형 그래프 데이터베이스 서비스로, 고도로 연결된 데이터 세트를 활용하는 애플리케이션을 손쉽게 구축하고 실행할 수 있게 해줍니다.

자세히 알아보기 »

Amazon Redshift

Redshift를 사용하면 표준 SQL을 통해 데이터 웨어하우스, 운영 데이터베이스 및 데이터 레이크에서 엑사바이트 규모의 정형 데이터 및 반정형 데이터를 쿼리하고 결합할 수 있습니다.

자세히 알아보기 »

Amazon S3

Amazon Simple Storage Service(Amazon S3)는 업계 최고의 확장성과 데이터 가용성 및 보안과 성능을 제공하는 객체 스토리지 서비스입니다.

자세히 알아보기 »

Amazon SageMaker

Amazon SageMaker를 통해 데이터 사이언티스트와 개발자는 기계 학습을 위해 특별히 구축된 다양한 기능 세트를 함께 활용하여 고품질 기계 학습 모형을 빠르게 준비, 구축, 훈련 및 배포할 수 있습니다.

자세히 알아보기 »


시작하기

Amazon Neptune에 대해 자세히 알아보세요. 클라우드용으로 구축된 빠르고 안정적인 그래프 데이터베이스입니다.