Historias de clientes / Servicios profesionales / Estados Unidos
Jobcase amplía los flujos de trabajo de machine learning para poder administrar miles de millones de predicciones diarias con Amazon Redshift ML
Jobcase, una comunidad en línea para trabajadores, utiliza Amazon Redshift ML para realizar miles de millones de predicciones de machine learning por día, lo que mejora la participación de los miembros en un 5 por ciento sin aumentar los costos.
Logró una mejora del 5 %
en las tasas de participación de los miembros sin aumentar los costos
Redujo el tiempo de prueba
de 1 a 2 meses a menos de una semana
Mejoró la escalabilidad
para apoyar a más de 110 millones de miembros
Realiza miles de millones de predicciones
en unos 15 minutos en lugar de 4 a 5 horas
Eliminó la necesidad de transferir datos
a un entorno de ML independiente
Información general
Como comunidad en línea para trabajadores y personas que buscan trabajo, Jobcase utiliza modelos de machine learning (ML) para analizar su base de datos con millones de ofertas de trabajo a fin de enviar recomendaciones de trabajo a sus miembros. Con más de 20 millones de visitantes únicos al mes, la página obtiene miles de millones de coincidencias todos los días. Para soportar esta carga de trabajo, la empresa necesitaba mejorar la escalabilidad de su motor de recomendaciones de búsqueda de empleo basado en ML y, al mismo tiempo, seguir siendo rentable.
Jobcase ya utilizaba Amazon Web Services (AWS) para la ingesta y el almacenamiento de más de 100 TB de datos comprimidos. Sin embargo, la empresa quería reducir significativamente la necesidad de transferir grandes cantidades de esos datos entre Amazon Redshift (un almacenamiento de datos que facilita la consulta y la combinación de exabytes de datos estructurados y semiestructurados) y su entorno de machine learning. Gracias a Amazon Redshift ML, que los analistas pueden utilizar para crear, entrenar y aplicar modelos de machine learning mediante los conocidos comandos SQL de Amazon Redshift, Jobcase puede realizar predicciones sobre miles de millones de registros en cuestión de minutos. Gracias a AWS, Jobcase ha mejorado la escalabilidad y, al mismo tiempo, ha reducido la relación costo-rendimiento. Ahora, la empresa puede brindar asistencia a su comunidad cada ves más grande de manera eficiente y poner a prueba características nuevas con mayor rapidez.
Oportunidad | Reducción de los gastos generales de los flujos de trabajo de ML
Jobcase es una plataforma de trabajo con una comunidad donde más de 110 millones de miembros registrados en los Estados Unidos se ayudan entre ellos y encuentran oportunidades. Si bien muchas páginas web de búsqueda de empleo se centran en empleos profesionales, las herramientas de búsqueda y las funciones sociales de Jobcase se centran en un espectro más amplio de los empleos cotidianos, donde tienen cabida los trabajadores por horas y del sector servicios, los comerciantes y los técnicos. Identificar coincidencias significativas permite a la empresa sugerir empleos de calidad para los afiliados y ayuda a las empresas a contratar trabajadores cualificados. Cuando alguien busca oportunidades de trabajo en Jobcase, la empresa analiza alrededor de 30 millones de anuncios en su directorio y compara las cualidades de cada uno con las preferencias de los miembros. Su infraestructura debe poder realizar estas tareas de machine learning a gran escala, recuperando y haciendo predicciones sobre miles de millones de registros al día. Jobcase ha utilizado Amazon Redshift durante más de 8 años como su almacén de datos principal, que sirve como fuente de información para todo su trabajo relativo al análisis de datos. “Nuestra base de datos almacena miles de millones de eventos todos los días”, afirma Ajay Joshi, ingeniero distinguido de Jobcase. “Todos nuestros sistemas de producción generan datos que van a parar a Amazon Redshift. La empresa depende de ello”. El flujo de trabajo de machine learning anterior de la empresa, que consistía en transferir datos de Amazon Redshift a un entorno independiente para ejecutar su software de machine learning antes de devolverlos a la base de datos, era ineficiente, propenso a errores y costoso. Para superar estos retos, Jobcase migró a Amazon Redshift ML para poder realizar sus funciones de machine learning dentro del almacén de datos, sin necesidad de transferir datos. La empresa comenzó a probar Amazon Redshift ML en diciembre de 2020 y lo llevó a producción en julio de 2021. “El nuevo sistema de AWS encaja en nuestro proceso tal como está”, afirma Joshi. “Pudimos implementar varios modelos en producción rápidamente, que empezaron a generar beneficios de inmediato.
Amazon Redshift es una de las herramientas más importantes que tenemos para hacer crecer a Jobcase como empresa”.
Ajay Joshi
Distinguished Engineer, Jobcase
Solución | Mejora de la escalabilidad y la velocidad con Amazon Redshift ML
El uso de Amazon Redshift ML simplifica la forma en que Jobcase genera predicciones a partir de sus modelos de ML. “Gracias a Amazon Redshift ML, podemos adaptar una amplia gama de clases de modelos de machine learning sofisticadas a los datos directamente en nuestro almacén de datos de Amazon Redshift”, afirma Clay Martin, científico de datos sénior de Jobcase. Solo 4 semanas después de implementar los nuevos modelos en Amazon Redshift ML, la empresa ya había registrado una mejora de hasta un 5 % en sus métricas de participación para canales específicos de correo electrónico y notificaciones push. “Una mejora del 5 % en las métricas de participación se traduce en una mejor experiencia y retención de usuarios y en el correspondiente aumento de los ingresos”, afirma Martin. Ahora, Jobcase puede realizar inferencias de modelos en miles de millones de registros en cuestión de minutos, en lugar de entre 4 y 5 horas.
El sistema de recomendaciones genera recomendaciones específicas de ofertas de trabajo, así como sugerencias de búsqueda y recomendaciones de empresas, para cada uno de sus millones de miembros activos. A medida que la comunidad crece, aumentan los costos de mantener canalizaciones de datos complejas. “Hacemos una media de cinco a seis mil millones de predicciones fuera de línea todos los días”, afirma Joshi. El uso de las funciones de inferencia local integradas en la base de datos de Amazon Redshift ML elimina la necesidad de transferir datos entre entornos distintos. Como resultado, Jobcase ahorra costos y reduce la complejidad a la vez que aumenta la escala de sus cargas de trabajo de machine learning.
Además, Jobcase puede realizar pruebas de gran envergadura con mayor rapidez que antes. “Antes teníamos que hacer pruebas con grupos pequeños de usuarios durante uno o dos meses”, explica Martin. “Con Amazon Redshift ML, podemos realizar pruebas en conjuntos de datos completos en menos de una semana”. Esto facilita la creación y la iteración de los modelos de la empresa a un ritmo muy rápido. Además, la capacidad del servicio para entrenar e implementar modelos automáticamente contribuye a aumentar la productividad de los equipos de Jobcase. “Somos una empresa pequeña en relación con la cantidad de datos que procesamos”, afirma Joshi. “Realizar predicciones rápidamente y con poco trabajo para implementar los modelos en Amazon Redshift ML nos permite centrarnos en agregar valor a otros aspectos de nuestro producto”.
Y lo que es igualmente importante, al utilizar Amazon Redshift ML, Jobcase puede escalar sus cargas de trabajo de machine learning sin aumentar los costos. “Para lograr un alto rendimiento a esta escala en un sistema diferente, tendríamos que invertir una cantidad significativa de tiempo y dinero en optimizarlo”, afirma Joshi. En cambio, la empresa no se enfrentó a ningún aumento de costes cuando comenzó a utilizar Amazon Redshift ML, ya que la función se ejecuta dentro de su clúster Amazon Redshift existente. La elasticidad de trabajar en la nube facilita que Jobcase trabaje a gran escala, incluso a medida que crece la base de usuarios de la empresa. “Siempre hemos estado a la vanguardia a la hora de crear en AWS”, afirma Joshi. “Hemos tenido una relación excelente con los equipos de AWS, y ha sido fenomenal”.
Resultado | Análisis de datos a escala con AWS
Jobcase planea ampliar el uso de Amazon Redshift ML a otros equipos de la organización. “Ya estamos viendo cómo personas de otros equipos implementan modelos de Amazon Redshift”, afirma Martin. “Hacer que esto sea accesible a toda la organización es otro aspecto valioso de su escalabilidad”. Al obtener la capacidad de escalar su almacenamiento de datos y sus flujos de trabajo de machine learning sin aumentar los costos ni utilizar recursos excesivos, Jobcase puede ofrecer valor a su comunidad en continuo crecimiento. “Amazon Redshift es una de las herramientas más importantes que tenemos para hacer crecer Jobcase como empresa”, afirma Joshi.
Acerca de Jobcase
Jobcase es una comunidad en línea dedicada a empoderar y defender a los trabajadores del mundo. Su tecnología ofrece acceso a empleos, herramientas, recursos y conocimientos impulsados por la comunidad, lo cual ayuda a más de 110 millones de usuarios a prepararse para cualquier función.
Servicios de AWS utilizados
Amazon Redshift
Amazon Redshift utiliza SQL para analizar datos estructurados y semiestructurados en almacenamientos de datos, bases de datos operativas y lagos de datos, con hardware y machine learning diseñado por AWS para ofrecer rendimiento al mejor precio a cualquier escala.
ML de Amazon Redshift
Amazon Redshift ML facilita a los analistas de datos y desarrolladores de bases de datos la creación, el entrenamiento y la aplicación de modelos de machine learning mediante comandos SQL conocidos en los almacenes de datos de Amazon Redshift.
Más información »
Más historias de clientes de servicios profesionales
Comenzar
Organizaciones de todos los tamaños y de todos los sectores transforman sus negocios y cumplen sus misiones todos los días con AWS. Contacte nuestros expertos y comience hoy mismo su propia jornada en AWS.