Lernen
Artificial Agency treibt Always-on-KI-Gameplay mit AWS und Llama voran

Artificial Agency treibt Always-on-KI-Gameplay mit AWS und Llama voran

Wie war dieser Inhalt?

Artificial Agency entwickelt eine Verhaltens-Engine, die agentenbasierte KI in Spielen ermöglicht. Die Engine steuert intelligente Charaktere und Systeme, die die Absichten der Spieler analysieren und über lange Spielsessions hinweg natürlich reagieren können. Um dies in großem Maßstab umzusetzen, ist eine KI erforderlich, die in Echtzeit für Millionen gleichzeitiger Spieler läuft. Um diesen Anforderungen gerecht zu werden, arbeitet Artificial Agency mit Meta-Llama -Modellen und Amazon Web Services (AWS) zusammen, um kleine, spielspezifische Modelle zu optimieren, die eine starke Leistung bei einem Bruchteil der Größe größerer Modelle bieten. Dieser Ansatz reduziert die Infrastrukturanforderungen, senkt die Latenz und eröffnet Spielestudios neue kreative Möglichkeiten.

Intelligenz für die Spielewelt

Die meisten Spielfiguren folgen vorgegebenen Pfaden. Sie nutzen Skripte, Verhaltensbäume und begrenzte Entscheidungspfade, die sorgfältig darauf ausgelegt sind, mögliche Spielerhandlungen abzufangen – jedoch nur solche, die von den Designern vorhergesehen wurden. Was sie nicht können, ist improvisieren, sich anpassen oder in Echtzeit authentisch auf die Absichten eines Spielers reagieren. Genau diese Lücke soll Artificial Agency schließen. Das Unternehmen entwickelt eine Verhaltens-Engine, die agentenbasierte KI in Spiele bringt und dort intelligente NPCs, Begleiter und dynamische Systeme steuert.

„Bei traditionellen Systemen ist man auf geskriptete Interaktionen oder vordefinierte Verhaltensweisen beschränkt“, sagt Alex Kearney, Mitbegründer und Leiter des Bereichs Machine Learning bei Artificial Agency. „Wir ermöglichen etwas Dynamischeres – Agenten, die verstehen, was ein Spieler meint und nicht nur, was er sagt, und die auf eine Weise agieren, die sich zielgerichtet anfühlt.“ Ein Game-Director-System könnte spontan neue Begegnungen basierend auf dem Spielerverhalten erstellen. Wenn ein Spieler nach einem Bleistift fragt, könnte ein Charakter zu einem Schreibtisch gehen, einen aufheben und ihn zurückbringen. Ein Gefährte könnte bemerken, dass sich der Zustand eines Spielers verschlechtert, und ohne Aufforderung eingreifen.

Das System verfügt über integrierte Tools, die sich direkt in Unity, Unreal und andere Spiele-Engines integrieren lassen, sowie über eine Cloud-Plattform, die den Status und das Gedächtnis der Agenten verwaltet und steuert, wie sich das Verständnis eines Charakters im Laufe der Zeit entwickelt. Das Ziel, so erklärt Kearney, ist simpel: „Spiele-Studios wollen KI in das Gameplay einbinden, sodass es sich für die Spieler natürlich anfühlt, ohne selbst Machine-Learning-Experten werden zu müssen. Woran wir arbeiten, ist eine Möglichkeit für Entwickler, intelligente Charaktere und Systeme zu erschaffen, ohne die gesamte Komplexität selbst verwalten zu müssen.“

Die Bereitstellung in einem Live-Spiel bringt jedoch Einschränkungen mit sich, die sich von anderen KI-Anwendungen unterscheiden. Spiele erfordern Echtzeit-Performance über lange Spielsitzungen hinweg, strikte Latenzvorgaben und eine Infrastruktur, die in der Lage ist, Millionen von gleichzeitigen Spielern auf Hardware zu unterstützen, die bereits an ihre Grenzen gestoßen ist.

Von Frontier-Modellen zu spielspezifischer KI

Der Ansatz von Artificial Agency beginnt mit Modellen auf Frontier-Niveau und nutzt spielspezifische Daten, um kleinere, spezialisierte Modelle zu trainieren, die auf die Bedürfnisse des jeweiligen Spiels zugeschnitten sind. „Große Modelle können Beeindruckendes leisten, bringen aber Einschränkungen mit sich. Wenn die KI in einem Spiel ständig aktiv sein soll, ist etwas Kleineres, Effizienteres notwendig, das auf diese Umgebung abgestimmt ist.“ Ein Modell mit 70 Milliarden Parametern kennt die antike Geschichte, Astrophysik und weiß, wie man einen Kuchen backt. Ein beliebiges Spiel benötigt davon vielleicht einiges, aber nicht alles – und schon gar nicht zu den damit verbundenen Ressourcenkosten. Deshalb arbeitet Artificial Agency daran, Llama-Modelle in den Varianten 1B, 3B und 8B gegen eine Performance-Baseline von 70B feinabzustimmen. Diese Open-Source-Modelle bieten Anpassbarkeit, langfristige Stabilität und etwas, das in der kreativen Arbeit von großer Bedeutung ist: Eigenverantwortung. Ein Modell, das nach der künstlerischen Vision eines Studios entwickelt wurde, bleibt so, wie es ist – ohne überraschende Updates oder Modell-Drift, die das Verhalten der Charaktere schleichend verändern.

In den frühen Phasen dieses Trainings setzte Artificial Agency auf einen gestuften Prozess. Zunächst erfolgte das Supervised Fine-Tuning (SFT) („überwachte Feinabstimmung“), was die Zuverlässigkeit des Basismodells drastisch verbesserte. Bestärkendes Lernen mittels GRPO (Group Relative Policy Optimization) zielte anschließend auf verhaltensbedingte Probleme wie „Looping“ ab. Die Modelle wiederholten sich gelegentlich, blieben in Mustern stecken und schafften es nicht, die Erzählung voranzutreiben. In emergentem Gameplay mit gelockerten Sicherheitsvorkehrungen wird die Immersion schnell gestört. Zusätzliche Datensätze simulierten herausfordernde Szenarien, und eine eigens entwickelte Evaluierungs-Suite maß das Verhalten in realistischen

Spielkontexten. „Nach der Feinabstimmung“, sagt Dhruv Mullick, Senior Machine Learning Engineer bei Artificial Agency, „konnten wir die Zuverlässigkeit erheblich verbessern und das Modell an einen Punkt bringen, an dem es innerhalb des Spielsystems laufen konnte.“

AWS war während des gesamten Prozesses ein zentraler Partner. Artificial Agency nutzt Amazon SageMaker auf der Infrastruktur von Amazon Elastic Compute Cloud (Amazon EC2), um Modelle in großem Maßstab zu trainieren, zu evaluieren und zu iterieren. Das Team arbeitet zudem mit dem AWS- Innovationszentrum für generative KI (GenAIIC) zusammen, das beratende Unterstützung und Anleitung für Machbarkeitsstudien bietet, einschließlich Trainingsstrategien, Modellkonfigurationen und Ansätzen für großflächiges Training. AWS-Teams arbeiten direkt mit Artificial Agency zusammen, um Belohnungsfunktionen (Reward Functions) zu verfeinern, Fehler zu beheben und die Iteration zu beschleunigen. „AWS war ein starker Partner, der uns geholfen hat, diesen Prozess zu durchlaufen“, sagt Kearney, „indem wir verschiedene Trainingsansätze getestet, die Bewertung von Verhaltensweisen verfeinert und die Herausforderungen bewältigt haben, diese Modelle in einer Spieleumgebung leistungsfähig zu machen.“ Das AWS-Team implementierte zudem verteilte Trainingsarchitekturen, einschließlich Sequenzparallelismus zur Verarbeitung langer Eingabekontexte, sowie ein Multi-GPU-Setup für Training und Inferenz.

Der Beweis, dass kleiner auch smarter sein kann

Frühe Ergebnisse zeigten deutliche Fortschritte bei den Metriken, die im Spielkontext am wichtigsten sind. In einer Machbarkeitsstudie senkte die überwachte Feinabstimmung die Parse-Fehlerraten von ca. 78,7 Prozent auf etwa 1 Prozent. Die Erfolgsquoten bei zentralen Gameplay-Szenarien stiegen von rund 6 Prozent auf etwa 51 Prozent, und Looping-Verhaltensweisen wurden um etwa die Hälfte reduziert. Wie Mullick betont, sind diese Zahlen nur aufgrund dessen aussagekräftig, was sie repräsentieren: „Wir messen nicht nur abstrakte Benchmarks. Wir bewerten, wie sich das Modell in realen Gameplay-Szenarien verhält. Das umfasst Aspekte wie die Vermeidung von Wiederholungsschleifen, die Anpassungsfähigkeit an emergentes, spielergesteuertes Gameplay und die Aufrechterhaltung der Kohärenz über einen längeren Zeitraum.“

Interne Tests zeigten zudem, dass die feinabgestimmten kleineren Modelle in der spielspezifischen Leistung deutlich näher an die 70B-Baseline heranrückten. Mit anderen Worten: Ein 1B-Modell – obwohl es 70-mal kleiner ist – beginnt, wie ein Modell zu performen, das es eigentlich in den Schatten stellt, wenn es mit den richtigen Daten für den richtigen Kontext trainiert wird. Kleinere Modelle bedeuten geringere Anforderungen an die Infrastruktur, niedrigere Latenzzeiten und die Möglichkeit, KI in größeren Teilen eines Spiels einzusetzen, ohne dass Kosten die Kreativität einschränken. Zudem sagt Kearney: „Ein Modell auf dem Niveau von einer Milliarde Parametern kann auf Endverbraucher-Hardware laufen. Das ist ein bedeutender Wandel, denn es bedeutet, dass man nicht mehr für jede Interaktion auf eine groß angelegte Infrastruktur angewiesen ist.“ On-Device-Inferenz verändert die architektonischen, wirtschaftlichen und kreativen Möglichkeiten auf eine Weise, die schlichtweg nicht verfügbar ist, wenn ein großes Modell die einzige Option darstellt.

Die Arbeit ist noch im Gange: Das abschließende Modelltraining sowie qualitative Spieltests – einschließlich Live-Tests mit echten Spielern, bei denen das feinabgestimmte Modell gegen die 70B-Baseline verglichen wird – stehen noch bevor. „Wir verfeinern die Modelle noch und evaluieren weiterhin die Leistung“, sagt Kearney, „aber die ersten Signale sind vielversprechend. Wir sehen Fortschritte dabei, KI-gesteuertes Gameplay in Echtzeit im großen Maßstab realisierbar zu machen.“ Die nächste Generation von Spielfiguren wird nicht nur ihren Text kennen. Sie wird die Szene verstehen.

Sind Sie bereit, Modelle in großem Maßstab zu trainieren und bereitzustellen? Erfahren Sie, wie Amazon SageMaker und Amazon EC2 Sie dabei unterstützen können, KI-Workloads selbst für die anspruchsvollsten Echtzeitumgebungen zu erstellen, zu iterieren und zu betreiben.

Wie war dieser Inhalt?