학습
Artificial Agency, AWS와 Llama를 통해 상시 사용 가능한 AI 게임플레이 개선

Artificial Agency, AWS와 Llama를 통해 상시 사용 가능한 AI 게임플레이 개선

이 콘텐츠는 어떠셨나요?

Artificial Agency는 게임에서 에이전틱 AI를 지원하는 행동 엔진을 구축합니다. 이 엔진은 플레이어의 의도를 추론하고 장시간 플레이 세션에서 자연스럽게 반응할 수 있는 지능형 캐릭터와 시스템을 구동합니다. 이를 대규모로 구현하려면 수백만 명의 동시 플레이어를 대상으로 실시간으로 실행할 수 있는 AI가 필요합니다. Artificial Agency는 이 기준을 충족하기 위해 Meta Lama 모델과 Amazon Web Services(AWS)를 활용하여 대규모 모델보다 훨씬 작은 크기로 강력한 성능을 제공하는 소형 게임 전용 모델을 미세 조정하고 있습니다. 이러한 접근 방식은 인프라 수요를 줄이고 지연 시간을 단축하며 게임 스튜디오에 새로운 창의적 가능성을 열어줍니다.

게임 세계에 인텔리전스 제공

대부분의 게임 캐릭터는 정해진 경로에 있습니다. 플레이어가 하는 행동에 대응하도록 세심하게 설계된 스크립트, 행동 트리, 그리고 디자이너가 예상한 대로만 구성된 유한한 의사 결정 경로를 갖고 있습니다. 따라서 실시간으로 플레이어의 의도에 즉흥적으로 반응하거나, 적응하거나, 진정으로 대응하는 행동은 하지 못합니다. Artificial Agency는 이러한 격차를 좁히기 위해 탄생했습니다. 이 회사는 지능형 NPC, 동료, 동적 시스템을 지원하는 에이전틱 AI를 게임에 도입하는 행동 엔진을 개발하고 있습니다.

Artificial Agency의 공동 설립자이자 기계 학습 부문 책임자인 Alex Kearney는 “기존 시스템에서는 스크립팅된 상호 작용이나 사전 정의된 동작으로 제한되지만, 저희는 좀 더 동적인 상호 작용을 구현했습니다. 에이전트는 플레이어가 말하는 내용뿐만 아니라 플레이어 행동의 의미를 이해하고 의도적으로 행동할 수 있게 해줍니다”라고 말합니다. 게임 디렉터 시스템에서는 플레이어의 행동 방식에 따라 즉석에서 새로운 상황을 연출할 수 있습니다. 플레이어가 연필을 달라고 하면 캐릭터가 책상으로 걸어가서 연필을 집어 들어 가져올 수 있고, 동료는 플레이어의 체력이 떨어지는 것을 알아차리고 아무 말없이 조치를 취할 수 있습니다.

이 시스템은 Unity, Unreal 등의 게임 엔진에 직접 통합되는 엔진 내 도구와 에이전트 상태, 메모리, 시간 경과에 따른 캐릭터의 이해 변화를 관리하는 클라우드 플랫폼을 제공합니다. Kearney는 그 목표가 간단하다며 “게임 스튜디오는 플레이어에게 자연스럽게 느껴지는 방식으로 AI를 게임플레이에 도입하기를 원하지만, 이를 위해 기계 학습 전문가가 되기를 바라지는 않습니다. 저희가 만들고 있는 것은 개발자들이 복잡성을 직접 관리할 필요 없이 지능적인 캐릭터와 시스템을 만들 수 있는 방법입니다”라고 설명합니다.

하지만 이를 라이브 게임에서 구현할 때는 다른 AI 애플리케이션과는 다른 제약이 따릅니다. 게임에는 긴 플레이 세션에서의 실시간 성능, 엄격한 지연 시간 예산, 이미 한계에 다다랐던 하드웨어에서 수백만 명의 동시 플레이어를 지원할 수 있는 인프라가 필요합니다.

프론티어 모델에서 게임 전용 AI로

Artificial Agency의 접근 방식은 프론티어 스케일 모델에서 시작하여 게임별 데이터로 각 게임의 니즈에 맞는 작고 특화된 모델을 훈련하는 것입니다. “대규모 모델은 인상적인 작업을 수행할 수 있지만 제약이 따릅니다. 게임에서 AI를 항상 사용할 수 있게 하려면 더 작고 효율적이며 해당 환경에 맞게 조정된 무언가가 필요합니다.” 700억 개의 파라미터를 사용한 모델은 고대 역사, 천체물리학, 케이크 굽는 방법을 알고 있습니다. 어떤 게임에서든 그 중 일부는 필요하더라도 전부는 아닐 수도 있고 그에 따른 리소스 비용도 낭비일 수 있습니다. 이것이 바로 Artificial Agency가 70B 성능 기준에 맞춰 1B, 3B, 8B 버전에서 Llama 모델을 미세 조정하기 위해 노력하는 이유입니다. 이 오픈 소스 모델은 커스터마이징 기능, 장기적 안정성, 그리고 창작 작업에서 매우 중요한 요소인 소유권을 제공합니다. 스튜디오의 예술적 비전을 바탕으로 만들어진 모델은 갑작스러운 업데이트나, 시간이 지나면서 캐릭터의 행동 방식을 은밀히 바꾸는 모델 드리프트 없이 그 상태를 유지합니다.

이 훈련의 초기 단계에서 Artificial Agency는 단계별 프로세스를 따랐습니다. 감독형 미세 조정(SFT)이 먼저 도입되어 기본 모델의 신뢰성를 크게 높였습니다. 그런 다음 GRPO(그룹 상대적 정책 최적화)를 사용한 강화 학습은 루핑과 같은 기본 행동 문제를 해결했습니다. 모델은 반복되는 경우가 있었고, 패턴에 갇혀 이야기를 발전시키는 데 실패하기도 했습니다. 가드레일이 느슨해진 초창기 게임플레이에서는 몰입도가 빠르게 떨어집니다. 추가 데이터세트는 난이도 높은 시나리오를 시뮬레이션했으며, 특수 제작된 평가 도구 모음은 실제 게임 컨텍스트에서의 행동을

측정했습니다. Artificial Agency의 Senior Machine Learning Engineer인 Dhruv Mullick은 “미세 조정을 거친 후 신뢰성을 크게 개선되었고 모델을 게임 시스템 내에서 실행할 수 있는 수준까지 개선할 수 있었습니다”라고 말합니다.

AWS는 그 과정 내내 핵심 파트너였습니다. Artificial Agency는 Amazon SageMaker를 Amazon Elastic Compute Cloud(Amazon EC2)에서 사용하여 대규모로 훈련, 평가, 반복합니다. 또한 이 팀은 훈련 전략, 모델 구성 , 대규모 훈련 접근 방식을 비롯한 자문 지원 및 개념 증명 지침을 제공하는 AWS 생성형 AI 혁신 센터(GenAIIC)와도 협력하고 있습니다. AWS 팀은 Artificial Agency와 직접 협력하면서 보상 기능을 개선하고, 문제를 디버깅하고, 반복을 가속화합니다. Kearney는 “AWS는 저희가 이 프로세스를 반복할 수 있도록 도와준 강력한 파트너였습니다. 다양한 훈련 접근 방식을 테스트하고, 행동을 평가하는 방법을 개선하고, 이러한 모델이 게임 환경에서 작동하도록 하는 데 따르는 어려움을 해결해 주었습니다”라고 말합니다. 아울러, AWS 팀은 훈련 및 추론을 위한 다중 GPU 설정과 함께 긴 입력 컨텍스트를 처리하기 위한 시퀀스 병렬 처리 등의 분산 훈련 아키텍처도 구현했습니다.

작을수록 더 스마트할 수 있다는 것을 입증하다

초기 결과는 게임 컨텍스트에서 가장 중요한 지표 전반에 걸쳐 의미 있는 성과를 보여주었습니다. 개념 증명에서 지도 미세 조정을 통해 구문 분석 오류율이 약 78.7%에서 약 1%로 감소했습니다. 주요 게임플레이 시나리오의 통과율은 약 6%에서 약 51%로 높아졌고, 반복 재생 동작도 약 절반으로 줄었습니다. Mullick이 “저희는 단순히 추상적인 벤치마크를 측정하는 것이 아닙니다. 실제 게임플레이 시나리오에서 모델이 어떻게 동작하는지 평가하고 있습니다. 여기에는 루핑을 방지하는지, 새로운 플레이어 중심의 게임플레이에 적응할 수 있는지, 시간이 지나도 일관성을 유지하는지 여부 등이 포함됩니다”라고 강조한 것처럼, 이 수치가 의미 있는 이유는 중대한 지표를 나타내기 때문입니다.

내부 테스트에서도 미세 조정된 소규모 모델이 게임별 성능의 70B 기준선에 상당히 근접하는 것으로 나타났습니다. 다시 말해, 1B 모델모델은 규모가 70배 더 작지만, 올바른 컨텍스트의 데이터로 훈련하면 훨씬 거대한 모델에 가까운 성능을 내기 시작했습니다. 모델이 작을수록 인프라 요구 사항이 낮아지고 지연 시간이 줄어들며 창의성에 제약이 되는 비용 없이 게임 전반에 AI를 배포할 수 있습니다. 덧붙여 Kearney는 “10억 파라미터 수준의 모델은 소비자 하드웨어에서 실행될 수 있습니다. 이는 의미 있는 변화입니다. 더 이상 모든 상호 작용에서 대규모 인프라에 의존하지 않아도 되기 때문입니다”라고 말합니다. 디바이스 내 추론은 대규모 모델이 유일한 옵션일 때는 불가능했던 방식으로, 아키텍처, 경제, 창의적 측면에서 가능성의 변화를 불러옵니다.

이 작업은 아직도 진행 중입니다. 실제 플레이어를 대상으로 미세 조정된 모델을 70B 기준과 비교하는 실시간 플레이테스트를 포함한 최종 모델 훈련과 질적 플레이 테스트가 아직 진행 중입니다. Kearney는 “여전히 모델을 다듬고 성능을 계속 평가하는 중이지만, 초기 신호는 고무적입니다. AI 기반 실시간 게임플레이를 대규모로 실현하는 방향으로 진전이 이루어지고 있습니다”라고 말합니다. 차세대 게임 캐릭터는 자신의 대사만 말하는 것이 아니라, 상황을 이해하게 될 것입니다.

모델을 대규모로 훈련하고 배포할 준비가 되셨나요? Amazon SageMaker와 Amazon EC2를 사용하여 가장 까다로운 실시간 환경에서도 AI 워크로드를 구축, 반복, 실행할 수 있는 방법을 알아보세요.

이 콘텐츠는 어떠셨나요?