Historias de clientes/Software e Internet/Turquía

2023
Logotipo de Codeway

Codeway ahorra un 48 % en costos de computación para la IA generativa con las instancias G5 de Amazon EC2

Descubra cómo Codeway optimizó el rendimiento de precios para su aplicación de IA generativa, Wonder, mediante las instancias G5 de Amazon EC2 potenciadas con las GPU de NVIDIA.

Reducción del 48 %

en costos de computación

1,5 millones de usuarios activos al mes

en más de 160 países

Menos de 3,5 meses

para implementar en AWS

Optimización

de la administración operativa

Rendimiento

óptimo

Información general

Con más de 140 millones de usuarios en más de 160 países, Codeway ha tenido un impacto significativo en el mundo de las aplicaciones y juegos móviles gracias al poder de la inteligencia artificial generativa. A medida que su base de usuarios crecía, Codeway buscó mejorar la escalabilidad, la elasticidad y la rentabilidad de las cargas de trabajo que sustentan esta poderosa tecnología.

Tras recibir las recomendaciones de Amazon Web Services (AWS), Codeway decidió adoptar las instancias G5 de Amazon Elastic Compute Cloud (Amazon EC2) potenciadas con las GPU NVIDIA A10G Tensor Core, instancias basadas en GPU de alto rendimiento para aplicaciones de machine learning y de uso intensivo de gráficos, a fin de impulsar su aplicación de generación de imágenes, Wonder. Al optimizar la infraestructura de Wonder en AWS, Codeway ha mantenido un rendimiento óptimo, ha reducido los costos en comparación con su estrategia de computación anterior y ha escalado eficazmente para ayudar a millones de creadores de contenido a hacer realidad sus ideas.

Woman working on mobile phone in the station

Oportunidad | Escalar la computación para la IA generativa y, al mismo tiempo, reducir los costos de Codeway

Con sede en Estambul (Turquía), Codeway desarrolla aplicaciones y juegos móviles con tecnologías de vanguardia, en particular con IA generativa. Su aplicación Wonder convierte las palabras en imágenes digitales; los usuarios escriben palabras u oraciones y Wonder transforma esas entradas en ilustraciones mediante la implementación de modelos de difusión estable para la generación de imágenes basados en PyTorch en AWS. En función de su suscripción, los usuarios pueden descargar una versión de alta o baja calidad de la imagen.

Dado que Wonder ha sido descargado por más de 28,3 millones de usuarios, Codeway se esfuerza por maximizar sus capacidades de computación y GPU. La infraestructura de Wonder se distribuye entre varios proveedores de nube en varias regiones. Para las cargas de trabajo de inferencia de inteligencia artificial (IA), Codeway utilizaba GPU NVIDIA A100 Tensor Core alojadas en uno de estos proveedores. Sin embargo, se encontró con problemas de capacidad de las GPU que afectaron el rendimiento.

“Estas cargas de trabajo requieren un equipo con un uso muy intensivo de las GPU. Además, agregamos millones de usuarios cada mes, por lo que nuestra demanda de GPU no hace más que aumentar”, afirma Ugur Arpaci, Lead DevOps Engineer en Codeway. “A medida que pasamos de administrar cientos de GPU a miles, queríamos optimizar el costo y el rendimiento y encontrar una buena estrategia para la escalabilidad”.

Amazon EC2 ofrece una cartera de computación amplia y completa, con más de 600 instancias y una selección de las opciones más recientes de procesadores, almacenamiento, redes, sistemas operativos y modelos de compra para ayudar a los clientes a satisfacer mejor las necesidades de sus cargas de trabajo. Mientras Codeway buscaba formas de optimizar su rendimiento informático, descubrió una solución ideal: las instancias G5 de Amazon EC2 potenciadas con las GPU NVIDIA A10G Tensor Core. Si bien Codeway podía elegir entre GPU similares con otros proveedores de nube, no ofrecían la misma disponibilidad y escalabilidad que AWS.

“El equipo de AWS sugirió que podíamos cumplir nuestros objetivos de precio y rendimiento al adoptar las instancias G5 de Amazon EC2 con GPU NVIDIA A10G Tensor Core”, afirma Arpaci. “Empezamos a probarlas y obtuvimos buenos resultados.

kr_quotemark

En AWS, podemos segmentar nuestras cargas de trabajo para ofrecer un mejor rendimiento a nuestros usuarios”.

Ugur Arpaci
Lead DevOps Engineer, Codeway

Solución | Ejecutar modelos de difusión estable basados en PyTorch para Wonder en AWS en un plazo de 3,5 meses

Tras analizar el rendimiento de precios de las instancias G5 de Amazon EC2, Codeway trabajó en estrecha colaboración con el equipo de AWS para completar el proceso de incorporación. “Siempre estuvimos en contacto con los expertos de AWS”, afirma Arpaci. “Seguimos sus instrucciones y, a continuación, realizamos pruebas y calculamos los costos por nuestra parte. Para algunos modelos, nos dimos cuenta de que podíamos obtener mayores beneficios al implementar nuestra aplicación en las instancias G5 de Amazon EC2. Luego compartimos nuestros resultados y establecimos un ciclo de retroalimentación muy positivo”.

El proceso de incorporación fue rápido y fluido y, en 3,5 meses, Codeway ya estaba ejecutando cargas de trabajo de producción para Wonder en AWS. Ahora usa instancias G5 de Amazon EC2 con las GPU A10G para implementar casi todas las cargas de trabajo de inferencia de IA de la versión gratuita de Wonder. A fin de generar imágenes de alta definición para los suscriptores de pago, Codeway utiliza las GPU A100 más potentes, que generan contenido de mayor calidad en menos tiempo. Al utilizar las A10G y A100, la empresa puede cumplir con todos sus acuerdos de nivel de servicio en cuanto a los tiempos de producción.

“Sabíamos que las A10G eran menos potentes que las A100, pero algunas cargas de trabajo no requieren tanto rendimiento de GPU”, afirma Arpaci. “Ahora podemos liberar muchas de estas cargas de trabajo de nuestras GPU más potentes, que solo funcionan con características de usuarios prémium, como la generación de imágenes de alta calidad”.

Para mejorar aún más la rentabilidad y el rendimiento, Codeway ha adoptado clústeres en Amazon Elastic Kubernetes Service (Amazon EKS), un servicio administrado destinado a ejecutar Kubernetes en la nube de AWS y en centros de datos en las instalaciones, para ajustar de forma dinámica las instancias G5 de Amazon EC2 según sea necesario. Se implementó una solución personalizada de escalado automático en cada clúster de Amazon EKS, que solicita instancias adicionales de forma inteligente cuando aumenta la demanda.

Para administrar las instancias, Codeway confía en Karpenter, una solución de aprovisionamiento de nodos de código abierto. Este servicio determina y usa de manera efectiva los tipos de instancia apropiados en función de las necesidades de Codeway. “De hecho, Karpenter selecciona la cantidad de instancias requeridas para nosotros y las implementa, y luego nosotros implementamos la carga de trabajo requerida”, afirma Arpaci. “Todo el proceso está automatizado, lo que simplifica muchos factores desde una perspectiva operativa”.

Diagrama de la arquitectura

Resultado | Reducir los costos de computación en un 48 % para escalar de manera efectiva la IA generativa

La adopción de las GPU A10G incluidas en las instancias G5 de Amazon EC2 ha sido fundamental en el camino de Codeway hacia una arquitectura más rentable, sólida y escalable. La empresa puede escalar de manera eficaz para hacer frente a los picos y caídas del uso, con lo cual responde a las demandas de los usuarios de todo el mundo. Ahora, millones de usuarios de Wonder disfrutan de una experiencia mejorada con aplicaciones y juegos.

“Con las instancias G5 de Amazon EC2 impulsadas por las GPU NVIDIA A10G Tensor Core, podemos procesar un gran subconjunto de nuestras cargas de trabajo de inferencia de IA”, afirma Arpaci. “Al usar los aceleradores de GPU A10G en AWS, podemos segmentar nuestras cargas de trabajo para ofrecer un mejor rendimiento a nuestros usuarios”.

En AWS, Codeway mantiene un alto rendimiento y disponibilidad a un costo óptimo. Al ajustar el tamaño de las instancias G5 de Amazon EC2 y aprovechar las instancias de spot de Amazon EC2, que ejecutan cargas de trabajo tolerantes a errores con un descuento de hasta un 90 por ciento en comparación con los precios bajo demanda, la empresa redujo sus costos de computación en un 48 por ciento en comparación con la ejecución de todas sus cargas de trabajo en GPU A100. La versión gratuita de Wonder tiene como objetivo convertir a los usuarios en suscriptores de pago; al reducir los costos de computación de la oferta gratuita, Codeway puede adquirir más suscriptores al mismo precio.

De cara al futuro, Codeway utilizará los servicios de AWS para mantenerse a la vanguardia de la IA generativa. Planea profundizar su compromiso con AWS en el futuro y adoptar nuevos servicios para impulsar otros componentes de su infraestructura. Por ejemplo, Codeway está evaluando varios servicios de AWS, como AWS Batch, un servicio que facilita el procesamiento por lotes, el entrenamiento de modelos de machine learning y el análisis a escala, para estandarizar sus cargas de trabajo de entrenamiento de IA.

En AWS, Codeway ha logrado grandes avances para producir con éxito la IA generativa. Gracias a este viaje transformador, su marco de IA adaptable y resiliente está listo para respaldar su creciente base de usuarios.

Acerca de Codeway

Con sede en Estambul (Turquía), Codeway lanza aplicaciones móviles con inteligencia artificial generativa y otras tecnologías de vanguardia. Desde 2020, más de 140 millones de usuarios en más de 160 países han descargado sus aplicaciones.

Servicios de AWS utilizados

Amazon EC2

Amazon Elastic Compute Cloud (Amazon EC2) ofrece la plataforma de computación más amplia y completa, con más de 700 instancias y la posibilidad de elegir el procesador, almacenamiento, redes, sistema operativo y modelo de compra más reciente, en función de lo que mejor se ajuste a las necesidades que plantea su carga de trabajo.

Más información »

Instancias G5 de Amazon EC2

Las instancias G5 de Amazon EC2 son la última generación de instancias basadas en la GPU de NVIDIA y se pueden usar en una amplia gama de casos de uso de machine learning y de uso intensivo de gráficos.

Más información »

Amazon EKS

Amazon Elastic Kubernetes Service (Amazon EKS) es un servicio administrado por Kubernetes que sirve para ejecutar Kubernetes en la nube de AWS y en centros de datos en las instalaciones.

Más información »

AWS Batch

AWS Batch permite a los desarrolladores, científicos e ingenieros ejecutar de manera eficiente cientos de miles de trabajos de computación por lotes y de ML mientras optimiza los recursos de computación, para que pueda concentrarse en analizar los resultados y resolver problemas.

Más información »

Más historias de clientes de IA generativa

no se encontraron elementos 

1

Comenzar

Organizaciones de todos los tamaños y de todos los sectores transforman sus negocios y cumplen sus misiones todos los días con AWS. Contacte nuestros expertos y comience hoy mismo su propia jornada en AWS.