Historias de clientes / Software e Internet
AI21 Labs acelera la adopción de modelos de IA generativa con Amazon SageMaker
Descubra cómo AI21 Labs, líder en IA generativa y modelos de lenguaje de gran tamaño, entrenó previamente y lanzó rápidamente un modelo de 17 000 millones de parámetros con Amazon SageMaker.
Menos de 2 meses
desde el inicio del proyecto hasta su finalización
Entrenamiento previo de un modelo generativo
con 17 000 millones de parámetros
Permite a los ingenieros ahorrar tiempo
para que pueden centrarse en las tareas principales en lugar de en la configuración de la infraestructura.
Dos tercios de los clientes
adoptaron rápidamente el modelo Grande
Inferencia de baja latencia
que mejora la satisfacción de los usuarios.
Información general
AI21 Labs (AI21), líder en inteligencia artificial (IA) generativa y modelos de lenguaje de gran tamaño (LLM), quiere dotar a las empresas de LLM de última generación y aplicaciones de IA para crear soluciones de IA generativa. Inicialmente, AI21 lanzó dos modelos: uno con 7000 millones de parámetros y otro con 178 000 millones. Sin embargo, la empresa vio la oportunidad de ofrecer a los clientes un modelo de tamaño medio de 17 000 millones de parámetros que salvara las distancias entre los tamaños existentes. El nuevo modelo de lenguaje previamente entrenado preservaría la calidad de la generación de texto, por lo que sería casi igual que el modelo de mayor tamaño con un coste de inferencia mucho menor para AI21 y sus clientes.
Para crear ese modelo de manera eficiente, AI21 recurrió a Amazon Web Services (AWS) y entrenó el modelo básico en menos de 20 días con Amazon SageMaker, que crea, entrena y despliega modelos de machine learning (ML) para casi cualquier caso de uso con infraestructura, herramientas y flujos de trabajo completamente administrados.
Oportunidad | Uso de Amazon SageMaker para el entrenamiento previo de un LLM con 17 000 millones de parámetros de forma eficiente para AI21
Fundada en 2017, AI21 ofrece a las empresas acceso a sus modelos de lenguaje patentados con AI21 Studio, que más de 30 000 desarrolladores utilizan para crear sus propias aplicaciones de IA generativa. La empresa también ofrece su asistente de escritura y lectura basado en inteligencia artificial, Wordtune, que ayuda a decenas de millones de usuarios de todo el mundo a interactuar con el lenguaje escrito.
En agosto de 2021, AI21 lanzó su modelo de lenguaje Jurassic-1 en dos tamaños: el modelo Large es rápido y rentable, con 7500 millones de parámetros, y el modelo Jumbo ofrece resultados de texto de mayor calidad a un coste más elevado, con 178 000 millones de parámetros. Aunque los modelos más grandes ofrecen la máxima calidad, su explotación a gran escala puede resultar costosa y su manejo es menos ágil. Para ayudar a sus clientes a optimizar el equilibrio entre coste y calidad al operar a escala, en diciembre de 2022 AI21 entrenó previamente y lanzó su tercer modelo, Grande, con 17 000 millones de parámetros mediante Amazon SageMaker.
AI21 completó rápidamente el proyecto en menos de 2 meses desde su inicio, tardando menos de 20 días en entrenar previamente el modelo. Dado que los LLM son enormes redes neuronales con miles de millones de parámetros, su entrenamiento es un proyecto arduo y laborioso que requiere ingentes recursos de computación. Con Amazon SageMaker, AI21 experimentó un proceso de entrenamiento de modelos más sencillo y eficiente, y la empresa pudo escalar los trabajos de entrenamiento distribuidos en tantas GPU como fuera necesario. «Los arquitectos de soluciones de AWS fueron receptivos e interactivos, y pudimos solucionar los problemas y terminar el proyecto a tiempo», afirma Dan Padnos, vice president de Platform en AI21.
La empresa ya tenía experiencia con AWS y eligió Amazon SageMaker porque es rentable, fácil de usar y está completamente administrado. AI21 también pudo seguir utilizando su software de entrenamiento existente y ponerse en marcha rápidamente, lo que era importante mientras la empresa estaba desarrollando su negocio. Para entrenar previamente el modelo Grande en menos de 20 días, AI21 necesitó utilizar 256 GPU A100, repartidas en 32 instancias. El entrenamiento a gran escala requería una herramienta que pudiera orquestar la asignación de los nodos, hacer que los registros estuvieran disponibles en una ubicación central y reducir la supervisión manual. «Cuando se lleva a cabo un trabajo de entrenamiento distribuido de esta envergadura, todo tipo de retos técnicos que pueden parecer triviales o rutinarios pueden convertirse en un quebradero de cabeza», afirma Padnos. «Amazon SageMaker tiene características que puede utilizar para gestionar esa complejidad y reducir la cantidad de esfuerzo que su equipo necesita invertir en los detalles». Por ejemplo, Amazon SageMaker cuenta con características como comprobaciones de estado y registro centralizado que las empresas pueden utilizar para aumentar la eficiencia.
Como Amazon SageMaker gestiona los errores de los nodos, se reinicia con elegancia y orquesta grandes ejecuciones distribuidas, el equipo que trabaja en el entrenamiento previo del modelo puede centrarse en las tareas principales».
Dan Padnos
Vice President of Platform de AI21 Labs
Solución | Reducción de la latencia y aumento del crecimiento con un modelo previamente entrenado con Amazon SageMaker
Gracias a Amazon SageMaker, AI21 lanzó el nuevo modelo rápidamente. La empresa calcula que ahorrará varias semanas de tiempo en comparación con sus métodos de entrenamiento anteriores. «Como Amazon SageMaker gestiona los errores de los nodos, se reinicia con elegancia y orquesta grandes ejecuciones distribuidas, el equipo que trabaja en el entrenamiento previo del modelo puede centrarse en las tareas principales», afirma Padnos. «En lugar de abordar los retos técnicos, pueden evaluar cómo funciona el modelo y cómo progresa el entrenamiento».
La aceleración de los plazos era importante porque las capacidades del modelo Grande responden mejor a las necesidades de la mayoría de los clientes de AI21. Los clientes con casos de uso para consumidores, como la redacción automática de correos electrónicos, valoraron migrar del modelo Jumbo al Grande porque su gran escala requiere eficiencia de costes. Pocos meses después de introducir el modelo Grande, este representaba aproximadamente dos tercios del tráfico de la empresa. «Hemos visto una rápida adopción y estamos muy satisfechos con el resultado», afirma Padnos. «Nuestra experiencia con Amazon SageMaker fue muy positiva. Conseguimos el resultado que esperábamos a tiempo, dentro del presupuesto y sin problemas inesperados».
Un aspecto clave de las aplicaciones de IA generativa es la baja latencia de las inferencias, ya que la experiencia del usuario debe ser fluida. Cuando los usuarios redactan contenidos con una herramienta como Wordtune, quieren que la IA les sirva de referencia rápida sin ralentizar su proceso de reflexión. Con Amazon SageMaker, AI21 consiguió una latencia de baja inferencia con el modelo Grande para satisfacer mejor las necesidades del cliente, reduciendo la latencia cuatro veces para uno de sus grandes clientes. Gracias a ello, los clientes de AI21 pueden dar servicio a millones de usuarios a diario casi en tiempo real sin que la experiencia del usuario se vea afectada. «Uno de nuestros clientes a gran escala ha observado una mejora significativa en las métricas de satisfacción de los usuarios, que atribuye a la reducción masiva de la latencia al migrar del modelo Jumbo al modelo Grande», afirma Padnos.
El lanzamiento del modelo Grande también ha contribuido al crecimiento tanto de AI21 como de sus clientes. «Tras lanzar el modelo Grande, que se entrenó con Amazon SageMaker, hemos observado un crecimiento de nuestro tráfico global», afirma Padnos. «Los clientes individuales que han migrado al modelo Grande también han aumentado su tráfico».
Resultado | Creación de la próxima generación de LLM con Amazon SageMaker
El modelo Grande (ahora llamado Mid) está disponible en Amazon SageMaker JumpStart, un centro de ML con algoritmos integrados, modelos básicos y soluciones de ML prediseñadas que los usuarios de Amazon SageMaker pueden desplegar con unos pocos clics. El ciclo de vida de los datos está contenido en el entorno del usuario para mantener la privacidad, y una organización puede aplicar el modelo de lenguaje a sus datos sin escribir código ni necesitar una página de pruebas de código. La serie de modelos fundacionales de próxima generación de AI21, Jurassic-2, así como los modelos para tareas específicas, también están disponibles en Amazon SageMaker JumpStart.
AI21 confía en la creciente adopción de la IA generativa en todo el mundo en los próximos meses y años. Con los servicios de AWS, la empresa trabaja activamente en LLM que serán más rápidos, así como más precisos, fiables y rentables. «Tenemos muy buena relación con el equipo de AWS», afirma Padnos. «Los miembros del equipo han profundizado en los detalles técnicos con nosotros y han colaborado en tareas desafiantes. A lo largo de todo el proceso, el equipo de AWS ha sido creativo y ha tenido en cuenta nuestros retos y objetivos».
Para obtener más información, visite https://aws.amazon.com/sagemaker.
Acerca de AI21 Labs
La empresa de software AI21 Labs ofrece acceso a sus modelos de lenguaje patentados para que los desarrolladores creen aplicaciones de inteligencia artificial generativa, así como a su asistente de escritura y lectura, Wordtune, que funciona con inteligencia artificial.
Servicios de AWS utilizados
Amazon SageMaker
Amazon SageMaker ayuda a los científicos de datos y a los desarrolladores a preparar, crear, entrenar e implementar con rapidez modelos de machine learning (ML) de alta calidad al poner a disposición un amplio conjunto de capacidades especialmente creadas para ML.
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart es un centro de machine learning (ML) con modelos básicos, algoritmos integrados y soluciones de ML prediseñadas que puede desplegar con solo unos pocos clics.
Más información »
Más historias de clientes de IA generativa
Comenzar
Organizaciones de todos los tamaños y de todos los sectores transforman sus negocios y cumplen sus misiones todos los días con AWS. Contacte nuestros expertos y comience hoy mismo su propia jornada en AWS.