Histórias de clientes/Serviços profissionais/Estados Unidos
A Jobcase escala fluxos de trabalho de ML para dar suporte a bilhões de previsões diárias usando o Amazon Redshift ML
A Jobcase, uma comunidade on-line para trabalhadores, está usando o Amazon Redshift ML para fazer bilhões de previsões de machine learning por dia, melhorando o engajamento dos membros em 5% sem aumentar os custos.
Alcançou uma melhoria de 5%
nas taxas de engajamento dos membros sem aumento de custo
Reduziu o tempo de teste
de um a dois meses para a menos de uma semana
Maior escalabilidade
para apoiar mais de 110 milhões de membros
Faz bilhões de previsões
em cerca de 15 minutos em vez de 4 a 5 horas
Eliminou a necessidade de mover dados
para um ambiente de ML separado
Visão geral
Como uma comunidade on-line para trabalhadores e candidatos a emprego, a Jobcase usa modelos de machine learning (ML) para analisar seu banco de dados de milhões de anúncios de emprego, a fim de corresponder os membros com as recomendações de vagas. Com mais de 20 milhões de visitantes individuais por mês, o site faz bilhões de correspondências todos os dias. Para atender a essa workload, a empresa precisava melhorar a escalabilidade do seu mecanismo de recomendações para a busca de emprego baseado em ML e, ao mesmo tempo, manter o custo-benefício.
A Jobcase já estava usando a Amazon Web Services (AWS) para ingerir e armazenar mais de 100 TB de dados compactados. Porém, a empresa queria reduzir significativamente a necessidade de movimentar grandes quantidades de dados entre o Amazon Redshift, um data warehouse que simplifica a consulta e a combinação de exabytes de dados estruturados e semiestruturados, e seu ambiente de ML. Usando o Amazon Redshift ML, que os analistas podem usar para criar, treinar e aplicar modelos de ML usando comandos SQL conhecidos no Amazon Redshift, a Jobcase pode realizar previsões em bilhões de registros em questão de minutos. Usando a AWS, a Jobcase melhorou a escalabilidade e, ao mesmo tempo, reduziu a relação custo-performance. Agora, a empresa pode apoiar sua crescente comunidade de forma eficiente e testar novos recursos com mais rapidez.
Oportunidade | Reduzir a sobrecarga dos fluxos de trabalho de ML
A Jobcase é uma plataforma de trabalho apoiada pela comunidade, na qual mais de 110 milhões de membros registrados nos Estados Unidos se conectam para ajudar uns aos outros e encontrar oportunidades. Embora muitos sites de busca de emprego priorizem as vagas profissionais, as ferramentas de busca e os recursos sociais da Jobcase se concentram em um espectro mais amplo dos cargos rotineiros, incluindo trabalhadores pagos por hora e do setor de serviços, comerciantes e técnicos. A identificação de correspondências fortes permite que a empresa sugira empregos de qualidade para os membros e ajuda os empregadores a contratar trabalhadores qualificados. Quando alguém busca oportunidades de trabalho na Jobcase, a empresa analisa cerca de 30 milhões de anúncios em seu diretório, comparando as qualidades de cada um com as preferências do membro. A infraestrutura deve ser capaz de realizar essas tarefas de ML em grande escala, recuperando e fazendo previsões em bilhões de registros por dia. A Jobcase usa o Amazon Redshift há mais de 8 anos como seu principal data warehouse, atuando como a fonte da verdade para todo o seu trabalho de análise de dados. “Nosso banco de dados ingere bilhões de eventos todos os dias”, diz Ajay Joshi, engenheiro renomado da Jobcase. “Todos os nossos sistemas de produção geram dados que fluem para o Amazon Redshift. A empresa depende disso.” O fluxo de trabalho de ML anterior da empresa, que envolvia a transferência de dados do Amazon Redshift a um ambiente separado para executar o software de ML antes de devolvê-los ao banco de dados, era ineficiente, propenso a erros e caro. Para superar esses desafios, a Jobcase migrou para o Amazon Redshift ML com o objetivo de executar suas funções de ML dentro do data warehouse, sem a necessidade de movimentar os dados. A empresa começou a testar o Amazon Redshift ML em dezembro de 2020 e o implantou na produção em julho de 2021. “O novo sistema na AWS basicamente se encaixa em nosso pipeline da forma como está”, diz Joshi. “Conseguimos implantar rapidamente vários modelos na produção que imediatamente começaram a gerar benefícios.”
O Amazon Redshift é uma das ferramentas mais importantes que temos para o crescimento da Jobcase como empresa.”
Ajay Joshi
Engenheiro renomado da Jobcase
Solução | Melhora na escalabilidade e na velocidade usando o Amazon Redshift ML
O uso do Amazon Redshift ML simplifica a forma como a Jobcase gera previsões em seus modelos de ML. “Por meio do Amazon Redshift ML, podemos ajustar uma ampla variedade de classes sofisticadas de modelos de ML aos dados diretamente em nosso data warehouse do Amazon Redshift”, afirma Clay Martin, cientista de dados sênior da Jobcase. Apenas 4 semanas após a implantação dos novos modelos no Amazon Redshift ML, a empresa já observava uma melhoria de até 5% em suas métricas de engajamento para canais específicos de e-mail e de notificações push. “Uma melhoria de 5% nas métricas de engajamento representa uma melhor experiência e retenção de membros e um aumento correspondente da receita”, diz Martin. A Jobcase agora pode fazer inferência de modelos em bilhões de registros em questão de minutos, em vez de 4 a 5 horas.
O sistema de recomendação gera recomendações específicas de anúncios de emprego, bem como sugestões de pesquisa e recomendações de empresas, para cada um de seus milhões de membros ativos. À medida que a comunidade cresce, os custos de manutenção de pipelines de dados complexos aumentam. “Fazemos uma média de cinco a seis bilhões de previsões off-line todos os dias”, afirma Joshi. O uso dos recursos de inferência local no banco de dados do Amazon Redshift ML elimina a necessidade de transferir dados entre ambientes separados. Como resultado, a Jobcase faz economias e reduz a complexidade enquanto aumenta a escala de suas workloads de ML.
Além disso, a Jobcase pode realizar grandes testes mais rapidamente do que antes. Martin conta que “Anteriormente, precisávamos realizar testes em pequenos grupos de usuários durante 1 a 2 meses. Usando o Amazon Redshift ML, podemos executar testes em conjuntos de dados inteiros em menos de uma semana.” Isso facilita a criação e a iteração dos modelos da empresa em um ritmo muito rápido. Além disso, a capacidade do serviço de treinar e implantar modelos contribui automaticamente para o aumento da produtividade das equipes da Jobcase. “Somos uma empresa pequena em relação à quantidade de dados que processamos”, diz Joshi. “Executar previsões com rapidez e com pouco trabalho necessário para implantar os modelos no Amazon Redshift ML permite que nós nos concentremos em agregar valor a outros aspectos do nosso produto.”
Outro aspecto igualmente importante é que, ao usar o Amazon Redshift ML, a Jobcase pode escalar as workloads de ML sem aumentar os custos. “Para alcançar uma alta performance nessa escala em um sistema diferente, teríamos que gastar uma quantidade significativa de tempo e dinheiro na otimização”, afirma Joshi. Em vez disso, a empresa não enfrentou nenhum aumento no custo quando começou a usar o Amazon Redshift ML porque o recurso funciona dentro do cluster existente do Amazon Redshift. A elasticidade do trabalho na nuvem simplifica o trabalho em escala da Jobcase, mesmo com o crescimento da base de usuários da empresa. “Sempre estivemos na vanguarda ao desenvolver na AWS”, diz Joshi. “Tivemos um ótimo relacionamento com as equipes da AWS, e isso tem sido fenomenal.”
Resultado | Execução de análises de dados em grande escala usando a AWS
A Jobcase planeja escalar o uso do Amazon Redshift ML para outras equipes dentro da organização. “Já estamos vendo pessoas de outras equipes implantarem modelos do Amazon Redshift”, diz Martin. “Tornar isso acessível em toda a organização é outro aspecto valioso da sua escalabilidade.” Com a capacidade de escalar seus fluxos de trabalho de data warehouse e ML sem aumentar os custos ou usar recursos excessivos, a Jobcase pode agregar valor à sua crescente comunidade. “O Amazon Redshift é uma das ferramentas mais importantes que temos para o crescimento da Jobcase como empresa”, observa Joshi.
Sobre a Jobcase
A Jobcase é uma comunidade on-line dedicada a capacitar e defender os trabalhadores do mundo todo. Sua tecnologia oferece acesso a empregos, ferramentas, recursos e conhecimentos desenvolvidos pela comunidade, ajudando mais de 110 milhões de membros a se prepararem para qualquer função.
Serviços da AWS usados
Amazon Redshift
O Amazon Redshift usa SQL para analisar dados estruturados e semiestruturados em data warehouses, bancos de dados operacionais e data lakes, usando hardware e machine learning projetados pela AWS para oferecer a melhor performance de preço em qualquer escala.
Amazon Redshift ML
Com o Amazon Redshift ML, analistas de dados e desenvolvedores de banco de dados podem criar, treinar e aplicar modelos de machine learning com mais facilidade, usando comandos SQL conhecidos em data warehouses do Amazon Redshift.
Saiba mais »
Mais histórias de clientes de serviços profissionais
Comece a usar
Organizações de todos os portes, em todos os setores, estão transformando seus negócios e cumprindo suas missões todos os dias usando a AWS. Entre em contato com nossos especialistas e comece sua própria jornada para a AWS hoje mesmo.