인터파크 고객 사례
2021
인터파크는 1996년에 설립된 국내 최초의 인터넷 쇼핑몰입니다. 당사는 수십년 간의 풍부한 경험을 통해 확고한 브랜드 파워와 독자적인 기술력을 갖춘 이커머스 전문 기업으로 성장했습니다. 쇼핑과 도서, 여행, 문화에 이르기까지 변화하는 라이프스타일에 맞춰 생활 속에 필요한 다양한 상품 및 서비스를 원스톱으로 제공하고 있습니다. 인터파크는 AI 및 빅데이터와 같은 새로운 IT 기술을 쇼핑에 접목해 사용자가 스마트한 쇼핑을 즐길 수 있도록 미래의 이커머스 환경을 구축하고 있습니다.
Amazon EMR은 더 저렴한 비용으로 프로젝트 단위로 완벽하게 분리할 수 있고, 이슈가 발생하면 AWS와 GS네오텍이 즉각적으로 지원했습니다. 이런 장점을 갖춘 Amazon EMR을 사용하지 않을 이유가 없었습니다.”
이성윤
데이터플랫폼 팀장, 인터파크
당면 과제
인터파크는 도서, 쇼핑, 티켓, 투어 등의 데이터를 통합 관리하고, 이를 기반으로 사용자 맞춤형 서비스와 혜택을 제공하기 위한 빅데이터 수집 및 분석이 필요했습니다. 빅데이터 분석을 위해 오픈소스 플랫폼인 온프레미스 상용 하둡을 사용했습니다. 그러나 온프레미스 상용 하둡의 높은 라이선스 비용과 운영 이슈 때문에 새로운 솔루션 도입을 검토하게 되었습니다. 라이선스 비용 때문에 기존에 IDC에서 사용하던 서버를 모두 활용할 수 없었고, 이 때문에 개발, 스테이징, 운영계를 분리해서 관리할 수 없었습니다. 결과적으로 개발 및 운영 이슈가 지속적으로 발생하게 되었습니다. 또한, 빅데이터 플랫폼 구축/운영 전문 인력이 없는 상황에서 이슈가 발생할 때마다 기술 지원을 받아야 하고, 지원을 받아 이슈 해결까지 너무 오래 걸리는 문제가 있었습니다. 인터파크 데이터플랫폼팀의 이성윤 팀장은 “내부에 빅데이터 플랫폼 전문가가 없는 상황에서 장애가 발생하면 외부 지원을 받아야 하고, 장애를 해결하기까지 너무 오래 걸렸습니다. 실제로 장애로 인해 개발계 및 운영계 사용을 중단한 적도 있어, 24/7 서비스를 지원하는 이커머스 입장에서는 가장 큰 걸림돌이었습니다.”라고 설명했습니다.
인터파크는 온프레미스 상용 하둡과 Amazon EMR의 비용 및 성능을 비교 분석한 후 클라우드 컴퓨팅 시장에서 오랜 기간 동안 경험을 쌓으면서, 방대한 APN 파트너 생태계를 보유한 AWS의 도움을 받기로 했습니다.
아마존 웹서비스를 선택한 이유
인터파크는 온프레미스 하둡으로 기존 서비스를 운영하면서 동시에 Amazon EMR로 마이그레이션을 시작했습니다. 기존 플랫폼과 Amazon EMR을 같이 운영하면서 비교 검증하고, 운영 통합 테스트를 진행해 성능과 보안을 검증했습니다. 아키텍처 설계부터 운영까지 Amazon Web Services(AWS)와 GS네오텍의 지원을 받아 IDC 서버 상의 모든 데이터를 Amazon EMR로 마이그레이션할 수 있었고, 2020년 12월부터 모든 데이터가 Amazon EMR을 통해 처리되고 있습니다. 기존 온프레미스 하둡은 리소스와 저장소가 통합되어 있어서 장애 발생 시 복구 시간이 길어지고, 장애가 복구될 때까지 해당 리소스와 저장소 사용이 불가능했습니다. 예정된 작업의 최대 리소스를 파악하여 클러스터를 구성해야 하기 때문에 비용도 증가했습니다. 게다가 빅데이터 플랫폼 구축은 업체에 의존해야 하는 이슈도 있었습니다. 반면 Amazon EMR은 리소스와 저장소가 분리되어 있어 장애에 신속한 대응이 가능하고, 스케일 인/아웃 기능을 활용해 성능 유지는 물론 비용 절감 효과도 볼 수 있었습니다.
이성윤 팀장은 “Amazon EMR을 통해 개발/스테이징/운영을 완벽하게 분리하고, 프로젝트 단위로도 분리가 가능해 다른 서비스에 영향을 주지 않는 안정적인 운영이 가능한 환경을 구축”하고, “Auto Scaling과 Amazon EC2 Spot Instance를 활용한 비용 최적화를 통해 비용을 절감”할 수 있었다고 설명했습니다. 인터파크는 빅데이터 집계 구현을 위해 Apache Spark를 사용하고, Amazon Simple Storage Service(Amazon S3)에 데이터를 저장하고, 데이터 처리 플랫폼으로 Amazon EMR을 사용하고 있습니다.
혜택
인터파크는 2020년 12월에 Amazon EMR로 마이그레이션한 후 모든 데이터를 EMR을 통해 처리하고 있으며, 장애 없이 서비스를 운영하고 있습니다. 또한, AWS와 GS네오텍의 솔루션 아키텍트 지원을 통해 AWS 전반적인 기술을 이해하고 활용할 수 있게 되었고, 컨설팅 서비스를 통한 아키텍처 고도화로 계획한 기간 내에 구축을 성공적으로 완료할 수 있었습니다.
Amazon EMR을 통해 프로젝트 단위까지 분리가 가능해서 다른 서비스에 영향을 주지 않아 안정적인 운영이 가능하고, Amazon EMR의 유연성 덕분에 기존 대비 50%의 비용 절감 효과도 볼 수 있었습니다. Amazon EMR은 컴퓨팅과 스토리지를 분리하여 독립적으로 규모를 조정하고 리소스 현황을 한눈에 파악할 수 있어, 개발자가 개발 업무에만 집중할 수 있도록 지원해 개발 생산성까지 크게 높아진 것으로 평가하고 있습니다. 이성윤 팀장은 EMR을 사용하면서 경험치가 쌓여 이슈가 발생해도 내부적으로 해결할 수 있게 되었고, 장애가 생기면 AWS와 GS네오텍이 신속하게 지원해줘 작업 생산성이 많이 증가했다고 전했습니다.
“기존 플랫폼은 개발계와 운영계를 분리할 수 없는 구조를 가지고 있어서 장애가 발생하면 전문 인력 부재로 외부 지원을 받아야 했고, 장애가 해결될 때까지 관련 업무가 모두 중단되었습니다. 당시 내부적으로 빅데이터 활용에 대한 수요가 증가하고 있어, 개선이 시급했습니다. Amazon EMR은 이런 문제를 모두 해결해주었습니다. 이런 장점을 갖춘 Amazon EMR을 사용하지 않을 이유가 없었습니다.”라고 설명했습니다.
인터파크는 Amazon EMR의 성공적인 마이그레이션을 기반으로 앞으로 비용 및 리소스를 최적화하고, 빅데이터를 기반으로 한 서비스 고도화에 나설 예정입니다. 효과적인 데이터 분석과 비즈니스 인사이트를 도출하기 위해 AWS 데이터레이크 구축도 계획하고 있습니다.
인터파크 정보
인터파크는 수십년 간의 풍부한 경험을 통해 확고한 브랜드 파워와 독자적인 기술력을 갖춘 이커머스 전문 기업입니다. 쇼핑과 도서, 여행, 문화 등 다양한 서비스를 원스톱으로 제공하고 있으며, AI 및 빅데이터 기술을 쇼핑에 접목해 사용자가 스마트한 쇼핑을 즐길 수 있도록 미래의 이커머스 환경을 구축하고 있습니다.
사용 이점
- 50%의 비용 절감
- 장애없이 운영이 가능한 안정적인 서비스
- AWS와 APN의 적극적인 지원
- 사용자 편의성이 높은 서비스
AWS 사용 서비스
Amazon EMR
Amazon EMR은 Apache Spark, Apache Hive, Apache HBase, Apache Flink, Apache Hudi 및 Presto와 같은 오픈 소스 도구를 사용하여 방대한 양의 데이터를 처리하기 위한 업계 최고의 클라우드 빅 데이터 플랫폼입니다.
Amazon EC2 Spot Instance
Amazon EC2 스팟 인스턴스를 사용하면 AWS 클라우드에서 미사용 EC2 용량을 활용할 수 있습니다. 스팟 인스턴스는 온디맨드 요금과 비교하여 최대 90% 할인된 금액으로 제공됩니다. 빅 데이터, 컨테이너식 워크로드, CI/CD, 웹 서버, 고성능 컴퓨팅(HPC), 테스트 및 개발 워크로드 등 다양한 상태 비저장, 내결함성 또는 유연한 애플리케이션에 스팟 인스턴스를 사용할 수 있습니다.
Amazon S3
Amazon Simple Storage Service(Amazon S3)는 업계 최고의 확장성, 데이터 가용성 및 보안과 성능을 제공하는 객체 스토리지 서비스입니다. 즉, 규모와 업종에 상관없이 고객이 이 서비스를 이용하여 데이터 레이크, 웹사이트, 모바일 애플리케이션, 백업 및 복원, 아카이브, 엔터프라이즈 애플리케이션, IoT 디바이스, 빅 데이터 분석과 같은 다양한 사용 사례에서 원하는 만큼의 데이터를 저장하고 보호할 수 있습니다.
AWS 시작하기
컴퓨팅 파워, 데이터베이스 스토리지, 콘텐츠 전송 또는 다른 기능 등 무엇을 찾고 있든 AWS는 유연성, 확장성 및 안정성이 향상된 정교한 애플리케이션을 구축하는 데 도움이 되는 서비스를 보유하고 있습니다.