Janssen Pharmaceuticals aumenta precisão do machine learning em 21% usando o Amazon SageMaker

2022

A Janssen Pharmaceuticals (Janssen), um grupo de empresas farmacêuticas que faz parte da Johnson & Johnson desde 1961, usa o machine learning (ML) para entender melhor a experiência dos pacientes que estão sendo submetidos às terapias da Janssen. Os cientistas de dados da Janssen usaram a Amazon Web Services (AWS) para automatizar o fluxo de trabalho de implantação e criar uma interface melhor entre ambientes de desenvolvimento e produção. Empregando serviços da AWS, incluindo o Amazon SageMaker, um serviço de ML que pode ser usado para criar, treinar e implantar modelos de ML para praticamente qualquer caso de uso, a Janssen implementou um processo automatizado de operações de ML (MLOps) que melhorou a precisão das previsões de modelos em 21% e aumentou a velocidade da engenharia de atributos em cerca de 700%, ajudando a Janssen a reduzir os custos e aumentar a eficiência.

Challenging research. Determined experienced scientist working with her microscope and wearing a uniform
kr_quotemark

Em vez de termos cada etapa do processo organizada sequencialmente, fomos capazes de paralelizar os trabalhos de preparação de dados e engenharia de atributos e a maneira como eles são orquestrados usando o AWS Glue combinado com o AWS Step Functions.”  

Jenna Eun
Cientista de dados principal da Janssen Pharmaceuticals

Em busca da automação em MLOps para acelerar as pesquisas

O portfólio de produtos da Janssen abrange uma ampla variedade de áreas terapêuticas, incluindo imunologia, doenças infecciosas, neurociência e oncologia. “É muito importante oferecer aos pacientes o melhor atendimento possível ao longo de suas complexas jornadas de tratamento. Por isso, usamos inteligência artificial e machine learning para entender como eles vivenciam a terapia e melhor atender às suas necessidades no desenrolar de suas doenças”, diz Jenna Eun, cientista de dados principal da Janssen.

Para acelerar o impacto das soluções baseadas em ML na experiência dos pacientes, a equipe da Janssen Business Technology Commercial Data Sciences decidiu se concentrar em MLOps, um conjunto de práticas que visa a implantar e manter modelos de ML em produção de maneira confiável e eficiente, aumentar a automação e atender aos requisitos comerciais e tecnológicos. “Nosso objetivo com MLOps é facilitar a experimentação e o rastreamento da performance dos modelos ao longo do tempo”, diz Eun. “A fácil experimentação e a exploração completa do espaço de hiperparâmetros são importantes para estabelecermos confiança nos modelos de machine learning.”

A Janssen decidiu montar uma equipe multifuncional para criar um processo automatizado de MLOps devido à importância de alinhar suas necessidades de tecnologia com os requisitos internos de segurança. “Como os processos que criamos usam dados de saúde, temos medidas rigorosas de segurança e privacidade que precisamos seguir de perto ao desenvolver e implementar nossas soluções de tecnologia”, diz Eun. No final de 2020, a equipe da Janssen Business Technology Commercial Data Sciences e a equipe da Johnson & Johnson Technology CloudX começaram a trabalhar em colaboração com a equipe de arquitetura de soluções do Amazon SageMaker e a AWS Professional Services, uma equipe global de especialistas capaz de ajudar as empresas a alcançar seus resultados comerciais desejados na AWS.

Aumento da velocidade e precisão do ML na AWS

Trabalhando com a equipe de arquitetura de soluções do Amazon SageMaker e a AWS Professional Services, a equipe da Janssen Business Technology Commercial Data Sciences e a equipe da Johnson & Johnson Technology CloudX automatizaram módulos de preparação de dados e engenharia de atributos em menos de 3 meses. Engenharia de atributos é o processo de criar variáveis de entrada a partir de dados de pacientes para o treinamento de modelos de ML supervisionados. Ao automatizar essas etapas, as equipes conseguiram acelerar a velocidade da preparação dos dados em cerca de 600% e a velocidade da engenharia de atributos em cerca de 700%. A Janssen fez isso usando o AWS Step Functions, um serviço de fluxos de trabalho visuais low-code que simplifica o sequenciamento das etapas necessárias para coletar, processar e normalizar dados de origem. O AWS Step Functions coordena trabalhos no AWS Glue, um serviço de integração de dados sem servidor que apresenta a funcionalidade de sincronizar ambientes de desenvolvimento e produção facilmente para uma implantação mais rápida de soluções de ML experimentadas e otimizadas. “Em vez de termos cada etapa do processo organizada sequencialmente, fomos capazes de paralelizar os trabalhos de preparação de dados e engenharia de atributos e a maneira como eles são orquestrados usando o AWS Glue combinado com o AWS Step Functions.”, diz Eun. “Isso tornou mais simples para nós conectar perfeitamente os ambientes de desenvolvimento e produção, de forma que tudo o que estamos experimentando possa ser rapidamente convertido em trabalhos do AWS Glue que, por sua vez, são iniciados pelo AWS Step Functions."

Depois de implementar a solução de MLOps na AWS, a Janssen aumentou a precisão de sua modelagem preditiva em 21%. “Como o pipeline de dados é mais automatizado e menos demorado, podemos dedicar mais tempo à performance do modelo”, diz Eun. A otimização de hiperparâmetros é essencial para melhorar a precisão do modelo de ML. Depois de definir os modelos e os dados, a equipe da Janssen usa o Amazon SageMaker para ajustar automaticamente um modelo, adaptando milhares de combinações de parâmetros de algoritmos para chegar às previsões mais precisas que o modelo é capaz de produzir. Essa automação combinada com seu algoritmo de otimização bayesiano reduz substancialmente o tempo de pesquisa por parâmetros. “Nós nos sentimos mais confiantes sobre o modelo de ML resultante, pois fizemos uma pesquisa completa de hiperparâmetros”, diz Eun.

A equipe da Janssen e a equipe da Johnson & Johnson Technology CloudX conseguiram documentar esse projeto e compartilhá-lo com outras equipes da Johnson & Johnson envolvidas em projetos de ML semelhantes. Compartilhar o aprendizado ajuda a acelerar projetos que também precisam estar em conformidade com as políticas de segurança da Johnson & Johnson e a promover uma cultura de MLOps por toda a organização. “Ao criar um padrão para outros seguirem, demonstramos como conectar diferentes serviços da AWS para criar um pipeline completo de ML dentro do ambiente da Johnson & Johnson”, diz Eun. “A capacidade de criar e aumentar a eficiência em partes do nosso processo anterior de desenvolvimento e implantação de ML abriu nossos olhos para a flexibilidade e a escalabilidade que podemos ter.”

Melhorar os tratamentos para pacientes em todo o mundo

A solução de MLOps da Janssen permite fornecer soluções de ciência de dados em grande escala. Eun diz: “À medida que implantamos nossa solução no mundo real e mostramos como ela pode fazer a diferença, pretendemos expandi-la para regiões geográficas mais amplas e aplicá-la a outros casos de uso comercial na Johnson & Johnson.”


Sobre a Janssen Pharmaceuticals

Como empresa da Johnson & Johnson desde 1961, a Janssen Pharmaceuticals é uma organização de pesquisa e desenvolvimento focada em melhorar os resultados dos pacientes com doenças graves em seis áreas terapêuticas, incluindo saúde cardiovascular, imunologia, neurociência e oncologia.

Benefícios da AWS

  • Aumento de cerca de 600% na velocidade de preparação de dados
  • Aumento de cerca de 700% na velocidade da engenharia de atributos
  • Precisão aprimorada dos modelos de ML em 21%
  • Estabelecimento de uma arquitetura padrão de referência de MLOps para outras equipes da Johnson & Johnson

Serviços da AWS usados

Amazon SageMaker

O Amazon SageMaker ajuda cientistas e desenvolvedores de dados a preparar, criar, treinar e implantar modelos de machine learning (ML) de alta qualidade rapidamente reunindo um amplo conjunto de funcionalidades criadas especificamente para ML.

Saiba mais »

AWS Step Functions

O AWS Step Functions é um serviço de fluxo de trabalho visual com pouco código utilizado por desenvolvedores para criar aplicações distribuídas, automatizar processos de TI e de negócios e desenvolver pipelines de dados e machine learning usando soluções da AWS.

Saiba mais »

AWS Glue

O AWS Glue é um serviço totalmente gerenciado de extração, transformação e carga (ETL) que facilita a preparação e a carga de dados para análises pelos clientes.

Saiba mais »

AWS Professional Services

A organização AWS Professional Services é uma equipe global de especialistas que pode ajudar a alcançar objetivos de negócios usando a Nuvem AWS.

Saiba mais »


Comece a usar

Organizações de todos os portes, em todos os setores, estão transformando seus negócios e cumprindo suas missões todos os dias usando a AWS. Entre em contato com nossos especialistas e comece sua própria jornada para a AWS hoje mesmo.