고객 성공 사례 / 소프트웨어 및 인터넷 / 터키
Codeway, Amazon EC2 G5 인스턴스를 사용하여 생성형 AI의 컴퓨팅 비용 48% 절감
Codeway가 NVIDIA GPU 기반 Amazon EC2 G5 인스턴스를 사용하여 생성형 AI 애플리케이션인 Wonder의 가격 성능을 최적화한 방법에 대해 알아보세요.
개요 | 기회 | 솔루션 | 성과 | 사용된 AWS 서비스 | 아키텍처 다이어그램
48% 절감
컴퓨팅 비용
월간 활성 사용자 150만 명
160개 이상의 국가
3.5개월 미만
AWS 기반 배포 시간
간소화
운영 관리
최적화
성능
개요
160개 이상의 국가에서 1억 4,000만 명 이상의 사용자를 보유한 Codeway는 생성형 인공 지능의 힘을 통해 모바일 애플리케이션 및 게임 분야에 상당한 영향을 미쳤습니다. 사용자 기반이 늘어남에 따라 Codeway는 이 강력한 기술을 뒷받침하는 워크로드의 확장성, 탄력성 및 비용 효율성을 개선하고자 했습니다.
Amazon Web Services(AWS)로부터 추천을 받은 Codeway는 이미지 생성 앱인 Wonder를 구동하기 위해 기계 학습 및 그래픽 집약적 애플리케이션을 위한 고성능 GPU 기반 인스턴스인 NVIDIA A10G Tensor Core GPU로 구동되는 Amazon Elastic Compute Cloud(Amazon EC2) G5 인스턴스를 채택하기로 결정했습니다. Codeway는 AWS에서 Wonder의 인프라를 최적화하여 최적의 성능을 유지하고, 이전 컴퓨팅 전략에 비해 비용을 절감하고, 수백만 명의 콘텐츠 제작자가 아이디어를 실현할 수 있도록 효과적으로 확장했습니다.
기회 | Codeway 비용을 낮추면서 생성형 AI를 위한 컴퓨팅 확장
터키 이스탄불에 본사를 둔 Codeway는 최첨단 기술, 특히 생성형 AI로 구동되는 모바일 애플리케이션과 게임을 개발합니다. Wonder 애플리케이션은 단어를 디지털 이미지로 변환합니다. 사용자가 단어나 문장을 입력하면 Wonder는 AWS의 PyTorch 기반 이미지 생성을 위한 Stable Diffusion 모델을 배포하여 이러한 입력을 아트워크로 변환합니다. 사용자는 구독에 따라 이미지의 고품질 또는 저품질 버전을 다운로드할 수 있습니다.
2,830만 명 이상의 사용자가 Wonder를 다운로드했기 때문에 Codeway는 컴퓨팅 및 GPU 기능을 극대화하기 위해 노력하고 있습니다. Wonder의 인프라는 여러 지역의 다양한 클라우드 제공업체에 분산되어 있습니다. 인공 지능(AI) 추론 워크로드의 경우 Codeway는 이러한 제공업체 중 한 곳에서 호스팅되는 NVIDIA A100 Tensor Core GPU를 사용하고 있었습니다. 그러나 성능에 영향을 미치는 GPU 용량 문제가 발생했습니다.
“이러한 워크로드에는 GPU를 많이 사용하는 하드웨어가 필요합니다. 또한 매달 수백만 명의 사용자가 추가되고 있기 때문에 GPU에 대한 수요는 계속 증가할 것입니다”라고 Codeway의 Lead DevOps Engineer인 Ugur Arpaci는 말합니다. “관리하는 GPU가 수백 개에서 수천 개로 늘어나면서 비용과 성능에 최적화하고 확장성을 위한 적절한 전략을 찾고 있었습니다.”
Amazon EC2는 600개 이상의 인스턴스와 최신 프로세서, 스토리지, 네트워킹, 운영 체제 및 구매 모델 옵션을 선택할 수 있는 광범위하고 심층적인 컴퓨팅 포트폴리오를 제공하여 고객이 워크로드 요구 사항을 최대한 충족할 수 있도록 지원합니다. Codeway는 컴퓨팅을 최적화할 방법을 모색하던 중 이상적인 솔루션을 발견했습니다. 그것은 바로 NVIDIA A10G Tensor Core GPU로 구동되는 Amazon EC2 G5 인스턴스였습니다. Codeway는 다른 클라우드 제공업체의 비슷한 GPU를 선택할 수 있었지만 그런 GPU는 AWS와 동일한 가용성과 확장성을 제공하지는 못했습니다.
Arpaci는 “AWS 팀은 NVIDIA A10G Tensor Core GPU로 구동되는 Amazon EC2 G5 인스턴스를 채택하여 가격 대비 성능 목표를 달성할 수 있다고 제안했습니다”라고 말합니다. “우리는 이것을 테스트하기 시작했고 좋은 결과를 보았습니다.”
AWS에서는 워크로드를 세분화하여 사용자에게 더 나은 성능을 제공할 수 있습니다.”
Ugur Arpaci
Codeway의 수석 DevOps 엔지니어
솔루션 | 3.5개월 이내에 AWS에서 Wonder용 PyTorch 기반 Stable Diffusion 모델 실행
Codeway는 Amazon EC2 G5 인스턴스의 가격 성능을 분석한 후 AWS 팀과 긴밀하게 협력하여 온보딩 프로세스를 완료했습니다. “우리는 항상 AWS의 전문가들과 연락을 주고받았습니다”라고 Arpaci는 말합니다. “AWS의 지침에 따라 테스트를 수행하고 우리 측에서 비용을 계산했습니다. 일부 모델의 경우 Amazon EC2 G5 인스턴스에 애플리케이션을 배포하면 최대한의 이점을 얻을 수 있다는 것을 깨달았습니다. 그런 다음 결과를 공유하고 매우 긍정적인 피드백 루프를 구축했습니다.”
온보딩 프로세스는 빠르고 원활했으며, Codeway는 3.5개월 만에 AWS에서 Wonder의 프로덕션 워크로드를 실행할 수 있었습니다. 이제 A10G GPU와 함께 Amazon EC2 G5 인스턴스를 사용하여 Wonder 무료 버전의 거의 모든 AI 추론 워크로드를 배포합니다. Codeway는 유료 구독자를 위한 풀 HD 이미지를 생성하기 위해 더 짧은 시간에 고품질 콘텐츠를 생성하는 더욱 강력한 A100 GPU를 사용합니다. A10G와 A100를 사용함으로써 이 회사는 출력 시간에 대한 모든 서비스 수준 계약을 준수할 수 있습니다.
Arpaci는 “A10G가 A100에 비해 성능이 떨어진다는 것은 알고 있었지만 일부 워크로드에는 그다지 많은 GPU 성능이 필요하지 않습니다”라고 말합니다. “이제 우리는 고화질 이미지 생성과 같은 프리미엄 사용자 기능에서만 작동하는 더 강력한 GPU에서 이러한 워크로드의 대부분을 오프로드할 수 있습니다.”
Codeway는 비용 효율성과 성능을 더욱 향상하기 위해 AWS 클라우드 및 온프레미스 데이터 센터에서 Kubernetes를 실행하는 관리형 서비스인 Amazon Elastic Kubernetes Service(Amazon EKS)에 클러스터를 채택하여 필요에 따라 Amazon EC2 G5 인스턴스를 동적으로 가동 및 축소합니다. 사용자 지정 Automatic Scaling 솔루션이 각 Amazon EKS 클러스터에 배포되어 수요가 발생할 때 지능적으로 추가 인스턴스를 요청합니다.
Codeway는 오픈 소스 노드 프로비저닝 솔루션인 Karpenter를 사용하여 인스턴스를 관리합니다. 이 서비스는 Codeway의 필요에 따라 적절한 인스턴스 유형을 효과적으로 결정하고 사용합니다. Arpaci는 “실제로 Karpenter가 필요한 인스턴스 수를 선택하여 배포해 주면 우리가 그 외에 필요한 워크로드를 배포합니다”라고 말합니다. “전체 프로세스가 자동화되어 운영 측면에서 많은 요소가 단순화되었습니다.”
아키텍처 다이어그램
성과 | 생성형 AI의 효과적인 규모 조정을 위한 컴퓨팅 비용 48% 절감
Amazon EC2 G5 인스턴스에 탑재된 A10G GPU를 채택한 것은 보다 비용 효율적이고 강력하면서 확장 가능한 아키텍처를 향한 Codeway의 여정에서 중요한 역할을 했습니다. 이 회사는 전 세계 사용자의 요구에 대응하여 사용량의 급증 및 감소에 맞춰 효과적으로 규모를 조정할 수 있습니다. 이제 수백만 명의 Wonder 사용자가 애플리케이션과 게임에서 향상된 경험을 누리고 있습니다.
Arpaci는 “NVIDIA A10G Tensor Core GPU로 구동되는 Amazon EC2 G5 인스턴스를 사용하면 AI 추론 워크로드의 상당 부분을 처리할 수 있습니다”라고 말합니다. “AWS 기반 A10G GPU 가속기를 사용하여 워크로드를 세분화함으로써 사용자에게 더 나은 성능을 제공할 수 있습니다.”
AWS에서 Codeway는 최적의 비용으로 고성능과 가용성을 유지합니다. Amazon EC2 G5 인스턴스의 크기를 적절하게 조정하고 내결함성 워크로드를 온디맨드 대비 최대 90% 할인된 가격으로 실행하는 Amazon EC2 스팟 인스턴스를 활용하여 A100 GPU에서 모든 워크로드를 실행하는 것에 비해 컴퓨팅 비용을 48% 절감했습니다. Wonder의 무료 버전은 사용자를 유료 구독자로 전환하는 것을 목표로 합니다. 무료 서비스의 컴퓨팅 비용을 낮춤으로써 Codeway는 동일한 가격대에서 더 많은 구독자를 확보할 수 있습니다.
앞으로 Codeway는 AWS 서비스를 사용하여 생성형 AI의 선두 자리를 유지할 것입니다. 향후 AWS와의 관계를 강화하고 인프라의 다른 구성 요소를 지원하는 새로운 서비스를 채택할 계획입니다. 예를 들어 Codeway는 AI 훈련 워크로드를 표준화하기 위해 배치 처리, 기계 학습 모델 훈련 및 대규모 분석을 용이하게 하는 서비스인 AWS Batch 등 여러 AWS 서비스를 평가하고 있습니다.
Codeway는 AWS에서 생성형 AI를 성공적으로 제품화하는 방향으로 큰 발전을 이루었습니다. 이 혁신적인 여정 덕분에 적응력과 복원력이 뛰어난 Codeway의 AI 프레임워크는 늘어나는 사용자층을 지원할 준비가 되었습니다.
Codeway 소개
터키 이스탄불에 본사를 둔 Codeway는 생성형 인공 지능 및 기타 첨단 기술을 기반으로 하는 모바일 애플리케이션을 출시합니다. 2020년 이후 160개 이상의 국가에서 1억 4천만 명 이상의 사용자가 애플리케이션을 다운로드했습니다.
사용된 AWS 서비스
Amazon EC2
Amazon Elastic Compute Cloud(Amazon EC2)는 700개가 넘는 인스턴스, 그리고 최신 프로세서, 스토리지, 네트워킹, 운영 체제 및 구매 모델의 옵션과 함께 워크로드의 요구 사항에 가장 잘 부합할 수 있도록 가장 포괄적이고 심층적인 컴퓨팅 플랫폼을 제공합니다.
Amazon EC2 G5 인스턴스
Amazon EC2 G5 인스턴스는 NVIDIA GPU 기반 인스턴스 중에서 최신 세대로, 다양한 그래픽 집약적 사용 사례와 기계 학습 사용 사례에서 사용할 수 있습니다.
Amazon EKS
Amazon Elastic Kubernetes Service(Amazon EKS)는 AWS 클라우드와 온프레미스 데이터 센터에서 Kubernetes를 실행하는 데 사용되는 관리형 Kubernetes 서비스입니다.
AWS Batch
AWS Batch를 사용하면 개발자, 과학자, 엔지니어가 수십만 개의 배치 및 기계 학습 컴퓨팅 작업을 효율적으로 실행하면서 컴퓨팅 리소스를 최적화하여 결과 분석 및 문제 해결에 집중할 수 있습니다.
생성형 AI 고객 사례 더 보기
시작하기
모든 산업에서 다양한 규모의 조직이 AWS를 통해 매일 비즈니스를 혁신하고 임무를 수행하고 있습니다. 지금 전문가와 상담하고 AWS로의 여정을 시작하세요.