Kundenberichte / Software und Internet / Türkei

2023
codeway-Logo

Codeway spart 48 % der Rechenkosten für generative KI mit Amazon EC2-G5-Instances

Erfahren Sie, wie Codeway die Preisleistung für seine generative KI-Anwendung Wonder mithilfe von NVIDIA-GPU-gestützten Amazon-EC2-G5-Instances optimiert hat.

Reduzierung um 48 %

bei den Rechenkosten

1,5 Millionen aktive Nutzer pro Monat

in mehr als 160 Ländern

Weniger als 3,5 Monate

bis zur Bereitstellung in AWS

Optimiertes

operatives Management

Optimale

Leistung

Übersicht

Mit über 140 Millionen Benutzern in mehr als 160 Ländern hat Codeway dank der Leistungsfähigkeit der generativen künstlichen Intelligenz die Welt der mobilen Anwendungen und Spiele maßgeblich beeinflusst. Mit dem Anwachsen der Benutzerbasis war Codeway bestrebt, die Skalierbarkeit, Elastizität und Kosteneffizienz der Workloads zu verbessern, die dieser leistungsstarken Technologie zugrunde liegen.

Nach Empfehlungen von Amazon Web Services (AWS) entschied sich Codeway für Amazon-Elastic-Compute-Cloud-(Amazon EC2)-G5-Instances powered by NVIDIA A10G Tensor Core GPUs, hochleistungsfähige GPU-basierte Instances für Machine Learning und grafikintensive Anwendungen, um seine Bilderzeugungs-App Wonder zu betreiben. Durch die Optimierung der Wonder-Infrastruktur in AWS konnte Codeway eine optimale Leistung beibehalten, die Kosten im Vergleich zu seiner vorherigen Rechenstrategie senken und effektiv skalieren, um Millionen von Content-Erstellern dabei zu helfen, ihre Ideen zum Leben zu erwecken.

Woman working on mobile phone in the station

Chance | Skalierung der Rechenleistung für generative KI bei gleichzeitiger Senkung der Kosten für Codeway

Codeway mit Sitz in Istanbul, Türkei, entwickelt mobile Anwendungen und Spiele auf der Grundlage modernster Technologien, insbesondere generativer KI. Die Wonder-Anwendung verwandelt Wörter in digitale Bilder. Benutzer geben Wörter oder Sätze ein, und Wonder verwandelt diese Eingaben in Kunstwerke, indem es stabile Diffusionsmodelle für die Bilderzeugung auf Basis von PyTorch in AWS einsetzt. Je nach Abonnement können Benutzer dann eine qualitativ hochwertige oder minderwertige Version des Bildes herunterladen.

Da Wonder bereits von mehr als 28,3 Millionen Nutzern heruntergeladen wurde, ist Codeway bestrebt, seine Rechen- und GPU-Kapazitäten zu maximieren. Die Infrastruktur von Wonder ist auf verschiedene Cloud-Anbieter in mehreren Regionen verteilt. Für Inferenz-Workloads mit künstlicher Intelligenz (KI) verwendete Codeway NVIDIA-A100-Tensor-Core-GPUs, die auf einem dieser Anbieter gehostet wurden. Es traten jedoch Probleme mit der GPU-Kapazität auf, die sich auf die Leistung auswirkten.

„Diese Workloads erfordern sehr GPU-intensive Hardware. Außerdem kommen jeden Monat Millionen von Nutzern hinzu, so dass unser Bedarf an GPUs nur steigen wird", sagt Ugur Arpaci, leitender DevOps-Ingenieur bei Codeway. "Da wir von der Verwaltung von Hunderten auf Tausende von GPUs umsteigen, wollten wir Kosten und Leistung optimieren und eine gute Strategie für die Skalierbarkeit finden."

Amazon EC2 bietet ein breites und umfangreiches Rechenportfolio mit über 600 Instances und einer Auswahl der neuesten Prozessor-, Speicher-, Netzwerk-, Betriebssystem- und Kaufmodell-Optionen, um Kunden dabei zu helfen, die Anforderungen ihrer Workloads bestmöglich zu erfüllen. Während Codeway nach Möglichkeiten suchte, seine Rechenleistung zu optimieren, entdeckte das Unternehmen eine ideale Lösung: Amazon-EC2-G5-Instances mit NVIDIA-A10G-Tensor-Core-GPUs. Obwohl Codeway eine Auswahl an ähnlichen GPUs bei anderen Cloud-Anbietern hatte, boten diese nicht die gleiche Verfügbarkeit und Skalierbarkeit wie AWS.

"Das AWS-Team schlug vor, dass wir unsere Preis-Leistungs-Ziele durch den Einsatz von Amazon-EC2-G5-Instances mit NVIDIA A10G Tensor Core GPUs erreichen könnten", sagt Arpaci. "Wir haben angefangen, das zu testen, und wir haben gute Ergebnisse gesehen."

kr_quotemark

In AWS können wir unsere Workloads segmentieren, um eine bessere Leistung für unsere Benutzer zu erzielen."

Ugur Arpaci
Lead DevOps Engineer, Codeway

Lösung | Ausführen von PyTorch-basierten stabilen Diffusionsmodellen für Wonder in AWS innerhalb von 3,5 Monaten

Nach der Analyse der Preisentwicklung von Amazon-EC2-G5-Instances arbeitete Codeway eng mit dem AWS-Team zusammen, um den Onboarding-Prozess abzuschließen. „Wir standen immer in Kontakt mit den Experten von AWS“, sagt Arpaci. „Wir haben ihre Anweisungen befolgt und dann Tests durchgeführt und die Kosten für uns berechnet. Bei bestimmten Modellen stellten wir fest, dass wir den größten Nutzen aus der Bereitstellung unserer Anwendung auf Amazon-EC2-G5-Instances ziehen konnten. Wir haben dann unsere Ergebnisse geteilt und eine sehr positive Feedbackschleife eingerichtet.“

Der Onboarding-Prozess verlief schnell und reibungslos, und innerhalb von 3,5 Monaten führte Codeway Produktionsworkloads für Wonder in AWS aus. Codeway verwendet jetzt Amazon-EC2-G5-Instances mit A10G GPUs, um fast alle KI-Interferenz-Workloads für die kostenlose Version von Wonder bereitzustellen. Um Bilder in voller HD-Auflösung für zahlende Subscriber zu generieren, verwendet Codeway die leistungsstärkeren A100-GPUs, die qualitativ hochwertigere Inhalte in kürzerer Zeit generieren. Durch den Einsatz von A10Gs und A100s kann das Unternehmen alle seine Service Level Agreements für die Produktionszeiten einhalten.

„Wir wussten, dass die A10G weniger leistungsstark sind als die A100s, aber einige Workloads erfordern nicht so viel GPU-Leistung“, sagt Arpaci. "Jetzt können wir einen Großteil dieser Workloads von unseren leistungsstärkeren GPUs abziehen, die jetzt nur noch für Premium-Benutzer-Features, wie z.B. hochwertige Bilderzeugung, eingesetzt werden."

Um die Kosteneffizienz und Leistung weiter zu verbessern, hat Codeway Cluster auf Amazon Elastic Kubernetes Service (Amazon EKS) eingeführt – einem verwalteten Service zur Ausführung von Kubernetes in der AWS Cloud und in On-Premises-Datenzentren, – um Amazon-EC2-G5-Instances nach Bedarf dynamisch hoch- und herunterzufahren. Auf jedem Amazon-EKS-Cluster wurde eine benutzerdefinierte Lösung zur automatischen Skalierung bereitgestellt, die bei Bedarf intelligent zusätzliche Instances anfordert.

Zur Verwaltung von Instances setzt Codeway auf Karpenter, eine Open-Source-Node-Provisioning-Lösung. Dieser Service bestimmt und verwendet effektiv die geeigneten Instancetypen auf der Grundlage der Anforderungen von Codeway. „Karpenter wählt tatsächlich die erforderliche Anzahl von Instances für uns aus und stellt sie bereit, und dann stellen wir die erforderliche Workload zusätzlich bereit“, sagt Arpaci. „Der gesamte Prozess ist automatisiert, was viele Faktoren aus betrieblicher Sicht vereinfacht.“

Architekturdiagramm

Ergebnis | Reduzierung der Rechenkosten um 48 % für eine effektive Skalierung generativer KI

Die Einführung von A10G-GPUs in Amazon-EC2-G5-Instances hat Codeway auf dem Weg zu einer kosteneffizienten, robusten und skalierbaren Architektur entscheidend unterstützt. Das Unternehmen kann effektiv skalieren, um Spitzen und Einbrüche in der Nutzung auszugleichen und auf die Anforderungen von Nutzern in aller Welt zu reagieren. Jetzt genießen Millionen von Wonder-Nutzern ein verbessertes Erlebnis mit Anwendungen und Spielen.

"Mit Amazon-EC2-G5-Instances, die von NVIDIA A10G Tensor Core GPUs angetrieben werden, können wir einen großen Teil unserer KI-Inferenz-Workloads verarbeiten", sagt Arpaci. „Durch die Verwendung von A10G-GPU-Beschleunigern in AWS können wir unsere Workloads segmentieren, um unseren Benutzern eine bessere Leistung zu bieten.“

In AWS sorgt Codeway für hohe Leistung und Verfügbarkeit zu optimalen Kosten. Durch die richtige Dimensionierung von Amazon-EC2-G5-Instances und die Nutzung der Amazon-EC2-Spot-Instances, die fehlertolerante Workloads ausführen und im Vergleich zu On-Demand-Preisen bis zu 90 Prozent günstiger sind, senkte das Unternehmen seine Rechenkosten im Vergleich zur Ausführung aller Workloads auf A100-GPUs um 48 Prozent. Die kostenlose Version von Wonder zielt darauf ab, Benutzer in zahlende Abonnenten umzuwandeln. Durch die Senkung der Rechenkosten für das kostenlose Angebot kann Codeway mehr Abonnenten zum gleichen Preis gewinnen.

Codeway wird auch in Zukunft AWS-Services nutzen, um im Bereich der generativen KI an der Spitze zu bleiben. Das Unternehmen plant, seine Zusammenarbeit mit AWS in Zukunft zu vertiefen und neue Dienste für andere Komponenten seiner Infrastruktur zu nutzen. Codeway evaluiert beispielsweise mehrere AWS-Services wie AWS Batch – einen Service, der Batch-Verarbeitung, Modelltraining für Machine Learning und Analysen in großem Maßstab ermöglicht, – um seine KI-Trainingsworkloads zu standardisieren.

In AWS hat Codeway große Fortschritte bei der erfolgreichen Produktivsetzung generativer KI gemacht. Dank dieser transformativen Reise ist das anpassungsfähige und widerstandsfähige KI-Framework bereit, seine wachsende Nutzerbasis zu unterstützen.

Über Codeway

Codeway hat seinen Hauptsitz in Istanbul, Türkei, und bringt mobile Anwendungen auf den Markt, die auf generativer künstlicher Intelligenz und anderen Spitzentechnologien basieren. Seit 2020 haben über 140 Millionen Nutzer in mehr als 160 Ländern die Anwendungen heruntergeladen.

Verwendete AWS-Services

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) bietet die breiteste und tiefste Compute-Plattform mit über 700 Instances und einer Auswahl der neuesten Prozessoren, Speicher, Netzwerke, Betriebssysteme und Kaufmodelle, damit Sie die Anforderungen Ihres Workloads optimal erfüllen können.

Weitere Informationen »

Amazon-EC2-G5-Instances

Amazon-EC2-G5-Instances sind die neueste Generation von NVIDIA-GPU-basierten Instances, die für eine Vielzahl von grafikintensiven und Machine-Learning-Anwendungen verwendet werden können.

Weitere Informationen »

Amazon EKS

Amazon Elastic Kubernetes Service (Amazon EKS) ist ein verwalteter Kubernetes-Service zum Ausführen von Kubernetes in der AWS Cloud und On-Premises-Rechenzentren.

Weitere Informationen »

AWS Batch

Mit AWS Batch können Entwickler, Wissenschaftler und Ingenieure Hunderttausende von Batch- und ML-Datenverwaltungsaufträge effizient ausführen und gleichzeitig die Datenverarbeitungsressourcen optimieren, sodass Sie sich auf die Analyse der Ergebnisse und die Lösung von Problemen konzentrieren können.

Weitere Informationen »

Weitere Kundengeschichten zur generativen KI

keine Elemente gefunden 

1

Erste Schritte

Organisationen aller Größen aus verschiedenen Sektoren transformieren ihre Unternehmen und erfüllen ihre Missionen täglich mithilfe von AWS. Kontaktieren Sie unsere Experten und begeben Sie sich noch heute Ihren Weg zu AWS.