AWS 기술 블로그
래빗워크의 디지털 콘텐츠 제작 혁신: AWS Deadline Cloud를 활용한 확장 가능한 렌더링 인프라 구축 사례
Rabbit Walks Inc.(이하 래빗워크)는 2010년 설립된 특수영상 전문 기업으로, 세계 최초 입체TV 콘텐츠 제작을 시작으로 업계를 선도해왔습니다. 삼성전자, LG, 현대차 등 글로벌 브랜드와 협업하며 고화질 시연 콘텐츠, 인터랙티브 전시 콘텐츠 등을 제작해왔고, CES, IFA, ISE, Infocomm와 같은 세계적인 전시 무대에서도 기술력을 인정받고 있는 한국의 대표적인 VFX 산업 기반의 회사입니다.
약 75명의 인력으로 구성된 래빗워크는 기획, 연출, 디자인, 작곡 등 콘텐츠 제작 전 과정을 자체적으로 수행할 수 있는 ‘올인원’ 조직 구조를 갖추고 있습니다. 이러한 ‘원스톱 솔루션’ 역량은 신속한 의사결정과 창의적인 아이디어의 즉각적인 구현을 가능하게 하지만, 동시에 프로젝트가 집중될 때 컴퓨팅 리소스, 특히 렌더링 파워에 대한 수요가 폭발적으로 증가하는 요인이 되기도 합니다.
특히 실시간 게임엔진 기반의 렌더링 없는 CG 콘텐츠 제작 기술을 바탕으로, 라이브 방송과 스트리밍 환경에 최적화된 VFX 워크플로우를 운영하고 있으며, 최근에는 AI 기술을 활용한 고화질 광고 콘텐츠 및 디지털 휴먼 제작까지 상용화에 성공했습니다. 이처럼 최첨단 기술을 적극적으로 도입하는 과정에서, AI 모델 학습이나 고해상도 최종 결과물 출력 등 기존의 실시간 워크플로우를 보완하는 대규모의 비실시간(batch) 렌더링 작업의 필요성이 대두되었습니다.
차세대 제품 개발 단계부터 고객사와 협력해 인터페이스 및 시각화 콘텐츠를 함께 개발하는 ‘선행 개발 콘텐츠’ 분야에서도 강점을 보이며, AR 글라스, 투명 OLED, 홀로그램 디스플레이, 모듈형 디스플레이 등 미래형 디바이스에 최적화된 콘텐츠를 지속적으로 선보이고 있습니다.
2025년에는 유럽 진출을 본격화하며 이탈리아 밀라노에 법인을 설립했고, 향후 파리 및 밀라노 올림픽 관련 프로젝트 수행을 준비 중입니다. 이러한 글로벌 확장과 초대형/초고화질 프로젝트는 예측 불가능한 규모의 렌더링 수요를 발생시키며, 기존의 고정된 온프레미스 인프라만으로는 대응하기 어려운 도전 과제를 제시합니다. 초대형/초고화질 사이니지, 공간 연출, 홀로그램 콘텐츠 등 차세대 인터랙티브 미디어 영역에서도 지속적인 기술 투자와 연구개발을 이어가고 있습니다.
Deadline Cloud 렌더팜 프로젝트의 도입 배경
래빗워크는 최첨단 기술력과 예술성을 결합하여 미디어 산업의 새로운 기준을 제시해왔습니다. 특히 AI 기술 융합, 18K 이상의 초고해상도 콘텐츠 제작, 글로벌 프로젝트 수행 등 비즈니스의 성공적인 확장은 기존 온프레미스 인프라에 새로운 도전 과제를 안겨주었습니다. 이러한 배경 속에서, 래빗워크는 미래 성장을 뒷받침할 유연하고 강력한 렌더링 환경 구축을 위해 클라우드 도입을 결정했으며, 그 핵심 솔루션으로 AWS Deadline Cloud를 선택했습니다.
이 과정에서 렌더팜에 대한 기술과 다양한 컴피턴시 역량을 보유하고 있는AWS의 파트너사인 메가존클라우드는 Deadline Cloud의 설계부터 기술 지원까지 전방위적인 파트너십을 제공하며, 래빗워크가 더욱 안정적이고 유연한 콘텐츠 제작 환경을 확보하는 데 핵심적인 역할을 수행했습니다.
기존의 문제 상황
현재 래빗워크는 약 50대 규모의 고사양 GPU(RTX 3080Ti 이상)로 구성된 내부 렌더팜을 운영하고 있습니다. 이는 분명 강력한 자산이지만, 비즈니스의 폭발적인 성장 속에서 다음과 같은 ‘성장통’을 겪고 있었습니다.
1. 리소스의 비효율적인 할당:
렌더 작업 시 여러 GPU 자원이 4개 또는 10개 단위의 고정된 그룹으로 할당되는 구조로 인해, 30명이 넘는 아티스트가 동시에 작업을 진행할 때 유휴 자원이 발생함에도 불구하고 특정 작업 그룹에 병목 현상이 발생하는 문제가 있었습니다. 이는 아티스트의 대기 시간을 늘리고 전체적인 생산성을 저하시키는 주요 원인이었습니다.
2. 예측 불가능한 수요에 대한 대응 불가:
최근 4K를 넘어 8K, 18K 이상의 초대형 프로젝트 수주가 증가하면서, 렌더링에 필요한 컴퓨팅 파워가 기하급수적으로 증가했습니다. 특정 프로젝트의 마감 기한이 임박했을 때, 순간적으로 평소의 몇 배에 달하는 렌더링 자원이 필요했지만, 물리적으로 한정된 온프레미스 팜으로는 이러한 피크 수요에 즉각적으로 대응할 수 없었습니다.
3. 막대한 증설 비용과 미래 불확실성:
이러한 문제를 해결하기 위해 렌더팜 증설을 검토했지만, GPU 장비 한 대에 수천만 원에 달하는 막대한 초기 투자 비용이 부담이었습니다. 더 중요한 문제는, 미래의 프로젝트 규모와 필요한 GPU 사양을 예측하기 어렵다는 점이었습니다. 지금 당장 거액을 투자해 증설하더라도, 1~2년 뒤에는 더 높은 사양의 GPU가 필요하거나, 반대로 프로젝트가 없는 기간에는 비싼 장비가 유휴 상태로 남아있게 되는 비효율이 발생할 수 있었습니다.
렌더팜 증설의 어려움
이러한 문제를 해결하기 위해 렌더팜 증설을 검토하였으나, 장비 한 대를 증설하는 데에만 최소 4천만 원 이상의 비용이 소요됩니다. 이는 단기적인 해결책으로는 적절할 수 있으나, 회사의 지속적인 성장과 그에 따른 인력 증가에 비례하는 렌더팜 확보에는 근본적인 한계가 있습니다.
결과적으로, 점점 더 많은 인원이 동시에 작업을 수행해야 하는 상황에서 현재의 팜 규모는 수요를 충족시키기 어려운 구조로, 장기적인 관점에서의 개선이 필요하였습니다.
기존 대안들의 한계와 새로운 기준의 필요성
래빗워크는 온프레미스 증설 외에 다른 대안들도 신중하게 검토했습니다.
- 단기 장비 임대: 외부 장비를 임대하는 방식은 작업 대비 비용 효율이 낮았고, 장비의 설치 및 철수 과정에 별도의 관리 인력과 시간이 투입되는 운영상의 번거로움이 컸습니다.
- 온라인 렌더팜 서비스: 기존의 상용 온라인 렌더팜 서비스들은 간헐적인 오류 발생 시 즉각적인 기술 지원이 어렵고, 특히 대규모 프로젝트를 장기적으로 진행할 경우 예측하기 힘든 비용 구조로 인해 실질적인 대안이 되기 어려웠습니다.
이처럼 기존 대안들의 명확한 한계는 래빗워크가 렌더링 인프라에 대한 새로운 기준을 세우게 된 계기가 되었습니다. 필요한 것은 단순히 더 많은 컴퓨팅 파워가 아니었습니다.
- 필요할 때, 필요한 만큼만 즉시 사용할 수 있는 ‘탄력성’
- 사용한 만큼만 비용을 지불하는 ‘경제성’
- 복잡한 설정 없이 아티스트가 창작에만 집중할 수 있게 해주는 ‘단순함’
- 안정적인 기술 지원이 보장되는 ‘신뢰성’. 바로 이 네 가지 기준이 차세대 렌더링 환경의 핵심 요구사항
렌더링 환경 개선의 노력에서 선택
이처럼 내부 렌더링 인프라의 구조적인 한계와 외부 대안의 비효율성으로 인해, 기존의 렌더링 환경을 보다 안정적이고 유연하게 운영할 수 있는 구조적 개선을 하고, 점점 고도화되고 복잡해지는 작업물의 퀄리티를 유지하고 향상시키기 위해서는 효율적인 자원 관리와 확장 가능한 시스템 구축을 통해, 향후 지속적으로 증가할 프로젝트 수요와 품질 요구에 능동적으로 대응할 수 있는 인프라가 필요하였고, 그 해법으로 AWS Deadline Cloud 서비스를 선택하게 되었습니다.
클라우드 렌더팜 도입과정과 당면한 어려움
AWS Deadline Cloud 도입 전략 수립
래빗워크의 기존 온프레미스(on-premise) 환경과 요구사항을 분석한 결과, AWS Deadline Cloud가 최적의 솔루션으로 판단 되었습니다. 하지만 기존 워크플로우와의 호환성, 아티스트들의 학습 곡선, 그리고 다양한 렌더링 엔진 지원 등 해결 해야 할 과제들이 있었습니다.
메가존클라우드와 함께 단계적 도입 전략을 수립하여, 위험을 최소화하면서도 실질적인 성과를 확인할 수 있는 로드맵을 설계했습니다.
1단계: SMF(Service Managed Fleet) 환경 구축 및 초기 테스트
- 기간: 2024년 10월 20일 ~ 2024년 11월 13일
- 목표: AWS Deadline Cloud의 기본 기능 검증 및 기존 워크플로우와의 호환성 확인
- 구성 환경:
- 렌더링 소프트웨어: Houdini 19.5
- 렌더링 엔진: Mantra
- 한계사항: Cinema4D 및 Redshift의 UBL(Usage-Based Licensing) 미지원 (2025년 Q1부터 지원하여 해당 기능 사용하여 워크로드 반영)
- 주요 성과:
- AWS Deadline Cloud의 기본 아키텍처와 작업 제출 프로세스 이해
- 클라우드 환경에서의 렌더링 성능 기준선 확보
- 네트워크 대역폭과 파일 전송 최적화 방안 도출
- 당면한 기술적 과제:
- 1. 라이선스 관리의 복잡성
- 기존 온프레미스 라이선스와 클라우드 환경 간의 호환성 문제
- UBL 방식의 라이선스 미지원으로 인한 소프트웨어 제약
- 2. 네트워크 최적화 필요성
- 대용량 3D 자산 파일의 업로드/다운로드 시간 이슈
- 사내 네트워크 대역폭 제약 식별
- 3. 워크플로우 표준화
- 기존 파이프라인과 클라우드 환경 간의 통합 방안 필요
- 1. 라이선스 관리의 복잡성
2단계: 성능 최적화 및 GPU 타입 선정
- 기간: 2025년 3월 ~ 2025년 4월
- 목표: Cinema4D 워크로드에 최적화된 GPU 인스턴스 타입 선정
- 테스트 방법론:
- 실제 프로덕션 프로젝트와 동일한 조건의 벤치마크 작업 수행
- 다양한 EC2 GPU 인스턴스 타입별 성능 및 비용 효율성 비교 분석
- 렌더링 복잡도에 따른 최적 인스턴스 구성 도출
- 성능 테스트 결과:
- 인스턴스 타입별 성능 비교:
- G4dn.xlarge: 기본 성능 기준선
- G5.2xlarge: 약 40% 성능 향상
- G6.12xlarge: 약 75% 성능 향상 (최종 선택)
- 비용 효율성 분석:
- 순수 렌더링 시간 대비 약 60% 비용 절감
- 프로젝트 턴어라운드 시간 90% 이상 단축
- 인스턴스 타입별 성능 비교:
- 기술적 인사이트:
- NVIDIA RTX A10G 기반 G5 인스턴스가 Cinema4D + Redshift 조합에서 최적 성능 발휘
- 메모리 집약적 작업에서는 G6 인스턴스의 우수한 GPU 메모리 효율성 확인
- Spot 인스턴스 활용 시 추가 30% 비용 절감 가능성 확인
3단계: CMF(Customer Managed Fleet) 전환 및 본격 운영
- 기간: 2025년 5월 15일 ~ 현재
- 목표: 완전한 프로덕션 환경 구축 및 확장 가능한 워크플로우 완성
- 주요 개선사항:
-
- 운영체제 최적화
- Linux 기반 렌더링 환경으로 전환
- 컨테이너 기반 워크플로우 도입으로 환경 일관성 확보
- 라이선스 관리 개선
- Cinema4D 및 Redshift의 클라우드 호환 라이선스 확보
- 동적 라이선스 할당 시스템 구축
- 자동화 및 모니터링
- CloudWatch를 통한 실시간 렌더링 작업 모니터링
- 자동 스케일링 정책 최적화
- 운영체제 최적화
- 운영상 도전과제와 해결방안:
- 도전과제 1: 아티스트 교육 및 적응
- 해결방안:
- 단계별 교육 프로그램 운영
- 기존 워크플로우와 유사한 UI/UX 제공
- 전담 기술지원팀 운영
- 해결방안:
- 도전과제 2: 하이브리드 환경 관리
- 해결방안:
- 온프레미스와 클라우드 간 작업 우선순위 자동 판단 로직 구현
- 통합 대시보드를 통한 전체 리소스 가시성 확보
- 해결방안:
- 도전과제 3: 비용 최적화
- 해결방안:
- 작업 패턴 분석 기반 예측 스케일링
- Reserved Instance 및 Spot Instance 혼합 활용
- 실시간 비용 모니터링 및 알림 시스템 구축
- 해결방안:
- 도전과제 1: 아티스트 교육 및 적응
도입 과정에서 얻은 핵심 교훈
- 점진적 마이그레이션의 중요성
- 단계별 도입으로 리스크 최소화 및 학습 효과 극대화
- 각 단계별 성과 측정을 통한 지속적 개선
- 기술 파트너십의 가치
- 메가존클라우드의 전문성이 도입 기간 단축 및 안정성 확보에 결정적 기여
- 24/7 기술지원을 통한 운영 안정성 확보
- 변화 관리의 중요성
- 아티스트 중심의 사용자 경험 설계
- 충분한 교육과 점진적 전환으로 저항 최소화
이러한 체계적인 도입 과정을 통해 래빗워크는 AWS Deadline Cloud를 성공적으로 프로덕션 환경에 통합할 수 있었으며, 이는 후속 성과로 이어지는 중요한 기반이 되었습니다.
테스트 환경 및 워크로드
<Deadline Cloud Rendering Architecture>
작업 사양
- 해상도: 8880 x 1890 (Ultra-wide 4K)
- 렌더링 엔진: 91 프레임 구성
- 예상 비용: $880 이상의 고사양 렌더링 작업
테스트 인프라 구성
온프레미스 환경 (로컬 PC)
- GPU: NVIDIA RTX 3080 Ti 4대 구성
- 1프레임 렌더링 시간: 약 32분
- 총 렌더링 시간: 약 12시간 8분
AWS Deadline Cloud 환경
- 인스턴스 타입: G6 12xlarge (GPU 최적화 타입 인스턴스)
- 테스트 구성: 1차, 2차, 3차 스케일링 테스트 진행
<Deadline Cloud Monitoring Dashboard>
성능 비교 결과
렌더링 시간 최적화
AWS Deadline Cloud의 스케일링 효과가 명확히 나타났습니다.
구성 | 1프레임 렌더링시간 | 총 렌더링시간 | 성능 향상 |
로컬 PC (RTX 3080 Ti x4) | 32분 | 12시간 8분 | 기준 |
Deadline Cloud 1차 | 15분 30초 | 47분 50초 | 93% 단축 |
Deadline Cloud 2차 | 8분 9초 | 39분 23초 | 95% 단축 |
Deadline Cloud 3차 | 16분 | 1시간 4분 | 91% 단축 |
핵심 성과
1. 극적인 성능 향상
- 최적 구성(2차 테스트)에서 총 렌더링 시간을 12시간에서 39분으로 95% 단축
- 단일 프레임 렌더링 시간을 32분에서 8분 9초로 75% 개선
2. 탄력적 확장성
- 워크로드에 따른 동적 리소스 할당으로 비용 효율성 극대화
- 피크 시간대 자동 스케일링으로 병목 현상 제거
네트워크 전송 최적화
파일 전송 성능
- 업로드: 렌더팜 → Dropbox 약 7-8분 (테스트 자동화 환경)
- 다운로드: Dropbox → 로컬 약 40분
- 네트워크 최적화: 사내 대역폭 제약이 주요 병목으로 식별
기술적 인사이트
1. 워크로드 분산의 효율성
AWS Deadline Cloud의 자동 작업 분산 기능이 91개 프레임을 여러 인스턴스에 최적 배분하여 처리 시간을 대폭 단축했습니다.
2. GPU 리소스 활용도
G6 12xlarge 인스턴스의 고성능 GPU가 복잡한 3D 렌더링 작업에서 온프레미스 환경 대비 우수한 성능을 보였습니다.
3. 비용 대비 효율성
초기 예상 비용 $880 대비 실제 클라우드 렌더링 비용의 효율성과 시간 단축으로 인한 운영비 절감 효과가 입증되었습니다.
결론
Rabbit Walks와의 협업을 통해 AWS Deadline Cloud가 기존 온프레미스 렌더팜 대비 다음과 같은 핵심 가치를 제공함을확인했습니다:
- 성능: 최대 95% 렌더링 시간 단축
- 확장성: 프로젝트 규모에 따른 탄력적 리소스 확장
- 비용 효율성: 사용한 만큼만 지불하는 모델로 운영비 최적화
- 관리 편의성: 인프라 관리 부담 제거
이번 테스트 결과는 3D 렌더링 스튜디오들이 클라우드 마이그레이션을 통해 얻을 수 있는 실질적인 비즈니스 가치를 명확히보여주었으며, AWS Deadline Cloud가 현대 미디어 제작 워크플로우의 핵심 솔루션임을 입증했습니다.
래빗워크 Deadline Cloud 아키텍쳐 외에 추가 구현 부분
래빗워크는 아티스트들의 원격 작업 환경을 지원하기 위해 EC2와 AWS DCV를 활용한 워크스테이션 구성을 진행했습니다.
하지만 아티스트들은 AWS 콘솔을 통한 EC2 서버 관리에 익숙하지 않았기 때문에, Cognito, CloudFront, S3, API Gateway를 조합하여 서버리스(Serverless) 기반 원격 서버 관리 페이지를 별도로 구축했습니다.
이를 통해 아티스트들은 간편하게 EC2 워크스테이션을 관리할 수 있게 되었고, 원격 서버를 사용하여 AWS 내부망을 통한작업 결과물의 Deadline Cloud 업로드 속도도 크게 향상 되었습니다.
또한 필요시 고 사양 서버로 쉽게 전환할 수 있어, 작업 효율성을 높이는 동시에 운영 및 유지보수에 대한 부담도 줄일 수 있는 환경을 마련했습니다.
<Rabbitwalks Renderfarm Process Architecture>
작업 결과에 대한 성능 부분
이번 프로젝트에서는 AWS Deadline Cloud를 도입하여, 온프레미스 환경에서는 기한 내에 완료하기 어려웠던 일정을 성공적으로 맞출 수 있었습니다.
특히, 당일 오전에 요청된 수정사항을 반영해 같은 날 오후에 영상을 제공하는 것은 기존 환경에서는 거의 불가능에 가까웠습니다. 그러나 래빗워크는 AWS Deadline Cloud를 활용하여, 촉박한 작업 일정에도 안정적으로 영상을 제공할 수 있었습니다.
기존 온프레미스 환경에서는 1프레임 렌더링에 약 32분이 소요되었지만, AWS Deadline Cloud 렌더팜을 이용한 결과15~16분으로 대폭 단축할 수 있었습니다.
<Rabbitwalks Renderfarm Architecture>
Deadline Cloud 도입 이후의 플랜
래빗워크는 Deadline Cloud 기반의 워크로드를 통해 빠르고 비용 효율적인 렌더링 워크로드를 구성하고 이를 통한 탄력적인 리소스 운용을 하고 있습니다. 차후 프로젝트로 작업물의 클라우드 이관을 통해서 강력한 DR구성과 영상 데이터의 빠른 운영과 GenAI를 통한 작업 기획을 하여 최종 산출물에 대한 도입을 가속화하는 작업을 진행중에 있습니다. 이를 통해 새로운 영상작업의 패러다임을 빠르게 실현하고 비즈니스의 강화를 도모하고 있습니다.