Criando uma plataforma de educação em saúde da próxima geração com Inteligência Artificial na AWS

Por Matheus Oliveira, arquiteto de soluções, AWS;

e André Santanchè, Ph.D. Doutor em Ciência da Computação e professor associado, Instituto de Computação (IC) – UNICAMP

A Inteligência Artificial tem o potencial de revolucionar áreas como a medicina e a educação, permitindo a criação de processos de ensino na área médica que gerem melhores cenários de aprendizado, amplificação do compartilhamento de informações, e melhor preparação de estudantes para tomada de decisões.

No entanto, muitos pesquisadores enfrentam desafios relacionados à infraestrutura necessária para construção dessas plataformas, como recursos limitados de hardware, escalabilidade e armazenamento de dados. Assim, a computação em nuvem surge como uma solução viável para superar essas barreiras, provendo as tecnologias e recursos mais atuais do mercado a poucos cliques de distância, pelo tempo necessário e com alta disponibilidade.

Um caso de sucesso da utilização da nuvem em iniciativas acadêmicas, é o projeto desenvolvido pela Universidade Estadual de Campinas (Unicamp), em parceria com a Amazon Web Services (AWS) e o Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq). Liderados pelo professor André Santanchè, eles têm a intenção de criar a próxima geração de plataforma de educação em saúde, utilizando Inteligência Artificial para criar cenários complexos da área médica, permitindo que estudantes possam aprender e evoluir autonomamente, aumentando seu conhecimento e produtividade.

Desse modo, o projeto foi dividido em duas facetas principais:

Plataforma de aprendizado interativo: Interface de interação de usuário com cenários pré-definidos que auxiliem o estudante em seu percurso de aprendizado. É disponibilizada globalmente (utilizando regiões na América do Norte, América do Sul e Europa) para diversos times no mundo com baixa latência, e conta com a utilização de serviços como Amazon EC2, Amazon S3 e Amazon RDS.
Processamento de Linguagem Natural (NLP): Com os dados obtidos e retidos na plataforma, utilizou-se o Amazon SageMaker para treinamento de modelos de linguagem natural, em especial Large Language Models, capazes de instruir, guiar e interagir com estudantes em seus percursos acadêmicos na plataforma, aproximando o usuário de cenários reais e complexos que se adaptem aos conhecimentos específicos de cada estudante. Os modelos treinados foram expostos com alta disponibilidade, segurança e monitoramento via endpoints no Amazon API Gateway.

Uma plataforma de alcance global

Com o objetivo de impactar a educação de estudantes no certame médico, André e sua equipe criaram a nova geração da plataforma Jacinto Bemelhor, a partir de uma colaboração com a Faculdade de Ciências Médicas da UNICAMP que desenvolveu a primeira geração da mesma. A plataforma conta com diferentes ambientes de interação, tais quais como atuar como autor em catálogos colaborativos, aprender de forma gamificada com cenários fictícios, construir cenários clínicos de pacientes e até mesmo interagir com imagens de ultrassom reais, realizando anotações e informações obtidas.

A arquitetura geral do projeto pode ser visualizada abaixo:

Para disponibilização do projeto, foram utilizados os seguintes serviços:

Amazon EC2, provendo recursos de computação altamente disponível para hospedagem da aplicação web;
Amazon S3, para armazenamento de dados BLOB como imagens, artefatos e prontuários com escalabilidade, disponibilidade e segurança;
Amazon RDS, solução de banco de dados relacional gerenciada para armazenamento de informações de usuários, facilitando a configuração, operação e escalabilidade da aplicação.

Modo Autor

Imerso na plataforma, um usuário pode acessar diversos templates de catálogos pré-definidos de casos reais e fictícios, no qual ele pode se basear para construir a história clínica de um paciente por meio da ferramenta de autoria do projeto, permitindo ao final, que este compartilhe este case novamente no catálogo público para que outros estudantes possam resolvê-lo interativamente e aprender de maneira colaborativa com o compartilhamento de informações e experiências de cada usuário.

Modo Jogador

Analogamente, ao ter a seu dispor um repositório de diversos casos clínicos para estudo, o usuário pode interagir de maneira gamificada com o cenário escolhido dentro do catálogo, e tomar decisões médicas que ao serem registradas, permitem ao estudante acompanhar seu desempenho e evolução na plataforma, entendendo possíveis pontos de melhora via aprendizagem prática e interativa.

Modo de aprendizagem via prognósticos

Dentro da plataforma é também possível que o estudante estimule seu aprendizado de maneira reversa, isto é, consiga sinteticamente criar dados clínicos de um paciente fictício e no fim tentar estabelecer seu prognóstico médico.Dessa maneira, estimula-se o raciocínio lógico por trás do mecanismo tomada de decisão em prognósticos e aprende-se características associadas a certos casos de maneira prática e interativa, permitindo melhor obtenção de insights ao aluno.

POCUS Notebooks

Graças a colaboração dos pesquisadores com o Hospital das Clínicas de Porto Alegre, foi criado um espaço de construção de cadernos de análises de imagens de ultrassom POCUS (Point-of-care), nos quais os estudantes podem carregar imagens de ultrassom, listar dados e decisões observadas na imagem analisada e serem avaliados, posteriormente, por instrutores que os auxiliem em pontos de atenção não observados ou incorretos.

Dessa maneira, o usuário pode aprender de maneira prática a observação de imagens clínicas e melhorar progressivamente seus conhecimentos na área sendo orientado por referências no certame.

Utilizando NLP para personalizar o aprendizado

Ao coletar dados advindos tanto das interações de usuários na plataforma, quanto de parcerias com outros hospitais e centros clínicos, os pesquisadores foram capazes de treinar modelos de Linguagem Natural, em especial Large Language Models, para melhorar a personalização de acompanhamento e tutoria dos usuários com modelos que se aproximassem cada vez mais de cenários reais e que fossem capazes de interpretar e adaptar as necessidades individuais de cada médico.

Dessa forma, ao utilizar modelos capazes de entender e adaptar contextos complexos, eles permitem uma maior imersão do usuário, explorando circunstâncias específicas de cada caso e melhorando significativamente a experiência final.

Para treinamento, personalização e disponibilização dos modelos foram utilizados os seguintes serviços:

Amazon SageMaker: Serviço de Machine learning totalmente gerenciado para construir, treinar, implantar e gerenciar modelos de maneira escalável. Para NLP, o SageMaker oferece recursos para treinar modelos em instâncias otimizadas, utilizando algoritmos pré-construídos específicos para tarefas de NLP, assim como integrar suas próprias soluções na plataforma. Após o treinamento, os modelos podem ser implantados como endpoints hospedados, dimensionáveis e altamente disponíveis. O SageMaker simplifica o gerenciamento da infraestrutura subjacente, permitindo que os desenvolvedores se concentrem na construção de modelos, e resultando também em potenciais economias de custos em comparação com infraestruturas dedicadas.
Amazon API Gateway: Serviço gerenciado da AWS que permite criar, publicar, manter, monitorar e proteger APIs de forma econômica. Ele atua como porta de entrada para que aplicativos acessem dados, lógica de negócios ou funcionalidades de outros serviços AWS, como Lambda e SageMaker. O API Gateway lida com tarefas como gerenciamento de tráfego, autenticação, autorização, monitoramento de uso e cobrança, possibilitando a criação de APIs RESTful e WebSocket altamente disponíveis, escaláveis e seguras.

Avaliando a capacidade de diagnósticos de médicos: Illness Script

Com um grande reduto de dados advindos da plataforma e infraestrutura gerenciada, os pesquisadores da UNICAMP têm explorado o uso de Inteligência Artificial para auxiliar ativamente médicos em sua tomada de decisão e raciocínio clínico, isto é, a construção de etapas lógicas sequenciais que justifiquem adequadamente um diagnóstico ou decisão médica.

Nesse processo é necessário criar mecanismos de avaliação tanto para a decisão tomada pelo médico quanto para o raciocínio empregado. Esse monitoramento é necessário para que médicos em preparação possam entender o quão prontos estão para situações de mundo real e quais são oportunidades de melhora e aprendizado. Desse modo, utiliza-se aprendizado de máquina que aliado a um conjunto de dados de treinamento anotado por médicos, é possível entender-se como esse estudante seria avaliado, tanto quantitativamente quanto qualitativamente.

Como esse processo demanda um alto grau de interação com usuário em relação ao escopo médico tal qual na interação comunicativa com o usuário, eles utilizaram o Amazon SageMaker Jumpstart para explorar algoritmos pré-treinados e Foundation Models em poucos cliques. Foram criados dois níveis de treinamento:

1. Reconhecimento de entidade utilizando o modelo BERT. Desse modo, após o estudante explicar os passos tomados para a decisão em relação a um certo caso clínico, o modelo retorna uma nota avaliativa sobre o raciocínio empregado na solução.

2. Gerando feedbacks qualitativos com o modelo Llama 2. Amplificando o caso de uso acima, ao utilizar o Large Language Model Llama 2, os pesquisadores conseguem além de gerar um feedback quantitativo ao usuário, ilustrar pontos levados em consideração para o resultado, aumentando a explicabilidade do modelo acerca dos pontos observados e permitindo ao aluno identificar rapidamente pontos de melhora e evolução.

Grafo de conhecimento: Semantic Virtual Patient

Simultaneamente, todos os dados coletados também foram utilizados pela equipe de pesquisadores para criação de um grafo de conhecimento que pode ser utilizado posteriormente como toda a base de conhecimento para as aplicações na plataforma.

Assim, ocorre a mesclagem de dados advindos de médicos, pesquisadores, inteligência artificial e estudantes via um modelo integrador, garantindo assim a robustez e abrangência de conhecimento retido na plataforma, com múltiplas fontes e expostas a diversos contextos, enriquecendo bastante as situações exploradas por médicos e estudantes.

Você pode conferir mais sobre este tópico no artigo de autoria do professor André Santanchè, dispon í vel aqui.

Resultados

Ao aproveitar de uma moderna infraestrutura tanto para treinar e utilizar modelos de inteligência artificial, quanto para expor globalmente a plataforma para diferentes países, a equipe de Santanchè registra uma crescente de usuários na plataforma, que tem planos de expansão para outros escopos como os campos de Enfermaria e Ética.

Projeto	Números obtidos
Jacinto Bemelhor	997 Pacientes virtuais
Aprendizagem baseada em equipes (Autor e Jogador)	4 blocos temáticos
	15 pacientes virtuais
	400 turmas de estudantes
Illness Script	12 pacientes virtuais
	8 questões abertas
	723 estudantes
	1430 respostas textuais
	344 textos anotados
	11412 anotações manuais
POCUS Learning	48 médicos e estudantes
POCUS Learning	1870 notebooks de pacientes
Aprendizagem via prognósticos	71 estudantes

A plataforma continua disponível publicamente e permite a estudantes cadastrados a entrada tanto como autor de cases para catálogo da plataforma, quanto para aprender de maneira gamificada no certame médico.

Conclusão

Dessa maneira, ao utilizarem da infraestrutura gerenciada e altamente disponível do Amazon SageMaker, a equipe de pesquisadores conseguiu valer-se de recursos de ponta para treinamento dos modelos com muita flexibilidade para experimentação e adaptação, algo que seria extremamente custoso e trabalhoso caso executado em ambientes on-premises. Desse modo, o professor André Santanchè destaca as vantagens de aproveitar a quantidade de recursos para desenvolvimento de pesquisas em ambiente cloud:

“Em ambientes de pesquisa em geral surgem dúvidas sobre quando utilizar uma infraestrutura local ou recursos de computação em nuvem. Para mim, a nuvem tem uma série de vantagens em relação ao modelo local, seja pela ausência de gestão de hardware, que envolve manutenção, atualização e uso contínuo para justificar o custo de investimento (que são extreamamente caros), quanto pela maior facilidade de gestão de pessoas e recursos, visto que em ambientes cloud não existe uma necessidade de divisão de horários para utilização tal qual permite que diferentes pesquisadores possam executar seus workloads simultaneamente em ambientes separados. “

Santanchè também destaca a flexibilidade de criação e personalização de aplicações de Inteligência Artificial na AWS, seja utilizando a infraestrutura gerenciada do Amazon SageMaker ou criando sua própria infraestrutura utilizando recursos de computação do Amazon EC2.

“Alguns integrantes da equipe utilizam o SageMaker pois o serviço tem pré-configurações e modelos gerenciados que nos auxiliam a economizar tempo e trabalhar rapidamente com modelos mais avançados disponíveis como o Llama, visto que com poucos cliques conseguimos instanciar o modelo e toda a infraestrutura computacional ao redor dele facilmente, garantindo inclusive uma maior confiabilidade no uso. Outros estão usando instâncias no Amazon EC2 para construir sua própria stack de inteligência artificial do zero. É interessante conseguir explorar simultaneamente esses dois mundos.”

Os pesquisadores da UNICAMP pretendem continuar expandindo a plataforma, atingindo mais públicos e buscar ter ainda mais impacto social, democratizando o ensino de saúde a diferentes estudantes. Para isso, eles querem continuar recursos modernos tanto para alta disponibilidade quanto para treinamento de modelos que os permita atingir cada vez mais pessoas.

“Usar nuvem é uma outra forma de fazer pesquisa. Flexibilidade, custo, contato com novas tecnologias e elasticidade são fundamentais para inovar mais rapidamente.”

A nuvem democratiza o acesso a tecnologias avantajadas de IA e computação, permitindo seu uso em aplicações reais, acelerando a inovação e diminuindo custos que tornem as aplicações inviáveis, aproximando pesquisadores mais rapidamente de seus objetivos.

Sobre os autores

Matheus Oliveira é arquiteto de soluções na AWS, especializado em engajamentos de Inteligência Artificial e Machine Learning. Com formação em Engenharia da Computação auxilia clientes a experimentarem soluções práticas e escaláveis, buscando impacto positivo e transformação por meio de computação em nuvem.

André Santanchè é Ph.D. Doutor em Ciência da Computação e professor associado do Instituto de Computação (IC) – UNICAMP, coordenador do Laboratório de Sistemas de Informação (LIS) do IC e diretor do Museu Exploratório de Ciências da Unicamp. Seus interesses de pesquisa envolvem três temas principais, também interligados: e-ciência (aplicada principalmente à saúde), ciência de dados (especialmente representação de conhecimento, processamento de linguagem natural e ciência de redes) e e-learning (plataforma colaborativa para aprendizagem e pesquisa).

Revisores

Iris Ferreira é arquiteta de soluções na AWS, apoiando clientes em suas jornadas de inovação e transformação digital na nuvem. Em seu tempo livre, gosta de velejar e estar sempre em contato com a natureza.

Marcelo Ferreira Baptista é Solutions Architect no time de AWS LATAM. Trabalha com soluções de TI há mais de 30 anos, com experiência em vários seguimentos de mercado e diferentes ambientes tecnológicos. Especialista em DevOps, Computing e HPC, hoje atua como Arquiteto de Soluções, apoiando os clientes nos seus desafios, buscando as melhores soluções para as suas necessidades.

Raquel Campos Ferreira estudante de Relações Internacionais. Atualmente trabalha na Amazon Web Services com foco no gerenciamento de projetos.

Rubem Paulo Torri Saldanha é formado em Ciência da Computação. Atualmente trabalha na AWS com foco em projetos logo prazo com governos e instituições de pesquisa.

O blog da AWS