O blog da AWS
Explorando e escalando criatividade com Agentes de IA
Por João Paulo Martins, CTO na Advolve, Rafael Gonchor, Engenheiro de software na Advolve e Phelipe Fabres, Sr. Arquiteto de Soluções de Generative AI na AWS.
Startups estão utilizando Large Language Models (LLMs) ou modelos fundacionais para criar aplicações inovadoras de IA generativa. A computação serverless permite que fundadores foquem em inovação e eficiência de capital, sem se preocupar com gestão de infraestrutura, enquanto escalam seus MVPs para produtos prontos para produção.
A Advolve enfrenta o desafio de escalar a geração de conteúdo (imagens e textos) mantendo qualidade e segurança. O que parece simples torna-se um quebra-cabeça multidimensional na prática.
Os obstáculos incluem: navegação pelas políticas de compliance de parceiros como Google e Meta, interpretação de brandbooks complexos com diretrizes subjetivas difíceis de processar por máquinas, APIs de IA com limitações e erros imprevisíveis, sistemas assíncronos que exigem alta escala, e o desafio de evitar conteúdo repetitivo sem originalidade.
Para superar esses desafios, a Advolve desenvolveu uma pipeline serverless distribuída que oferece alta escala sob demanda, gerenciamento de contexto mais efetivo e agentes de IA trabalhando com maior eficiência.
Infraestrutura da Solução
O primeiro problema que a Advolve precisava resolver era como escalar pipelines multi-agente sem comprometer o orçamento de cloud e como desacoplar essa operação das pipelines de “software tradicional”, permitindo maior robustez e tolerância a falhas. A solução encontrada pela equipe foi utilizar AWS Step Functions orquestrando funções AWS Lambda.
O AWS Step Functions é um serviço de orquestração serverless que permite coordenar múltiplos serviços AWS em workflows visuais. Já o AWS Lambda é um serviço de computação serverless que executa código sem necessidade de provisionar ou gerenciar servidores, cobrando apenas pelo tempo de computação efetivamente utilizado. Juntos, esses serviços formaram a espinha dorsal da arquitetura da Advolve.
Na prática, cada fluxo multi-agente se tornou uma Step Function independente, e cada agente dentro do fluxo se tornou uma função Lambda isolada. Cada fluxo foi estruturado como um ‘domínio especializado’ e, consequentemente, cada domínio possui uma responsabilidade única: gerar textos para imagens, gerar copies ou gerar apenas imagens. Essa separação clara de responsabilidades trouxe simplicidade arquitetural e facilitou a manutenção.
Em cada domínio, a equipe utiliza também o Amazon Bedrock, um serviço totalmente gerenciado que oferece acesso a modelos fundacionais de alta performance através de uma API unificada. O Amazon Bedrock permitiu que a Advolve acessasse diversos provedores de IA e integrasse APIs internas com modelos open-source. Isso proporcionou rastreabilidade mais confiável e melhor controle sobre os modelos utilizados em produção. A figura abaixo ilustra um pouco isso:

Para permitir o desacoplamento completo da plataforma principal e ter escala sob demanda, a startup decidiu utilizar o Amazon EventBridge. Este serviço de barramento de eventos serverless conecta dados de aplicações em tempo real, permitindo que diferentes partes do sistema se comuniquem de forma assíncrona e independente. Com o Amazon EventBridge, a Advolve conseguiu criar uma arquitetura verdadeiramente desacoplada, onde os fluxos de geração de conteúdo operam de forma autônoma, escalando automaticamente conforme a demanda dos clientes.
Fluxos Multi-Agentes
A escolha do framework
A Advolve tomou uma decisão estratégica ao selecionar o framework Agno para a construção de seus agentes inteligentes. A empresa identificou que esse framework oferece uma combinação única de facilidade e flexibilidade, permitindo que o desenvolvimento de agentes seja realizado de forma direta e sem processos burocráticos desnecessários. Essa escolha tecnológica tem se mostrado fundamental para acelerar a implementação de soluções de inteligência artificial personalizadas.
A importância do contexto
Um dos maiores desafios na geração automatizada de conteúdo é garantir que os agentes de IA compreendam e respeitem as particularidades de cada cliente. Para resolver essa questão, a Advolve desenvolveu um sistema robusto baseado em contextos específicos. Os clientes fornecem suas diretrizes de marca através de brandbooks, documentos que contêm todas as regras, preferências e restrições da identidade visual e comunicacional da empresa.
Esses brandbooks são processados e armazenados em bases vetoriais, uma tecnologia que permite a busca semântica eficiente de informações.
Quando um agente é acionado para construir um meta-prompt destinado à geração de imagens para essa marca, ele consulta automaticamente a base vetorial correspondente. Nessa consulta, o agente identifica restrições importantes, como a proibição de utilizar uma cor expecifica nas criações. Isso por que, essa tonalidade pode estar associada a um concorrente de um determinado cliente.
Esse nível de personalização demonstra como os agentes conseguem não apenas gerar conteúdo, mas fazê-lo com consciência estratégica de acordo com as características de cada cliente dentro do seu mercado.
Padrões multi-agentes
A implementação de sistemas multi-agentes tem se mostrado uma abordagem robusta para geração automatizada de conteúdo publicitário. Vamos explorar como padrões estabelecidos de arquitetura multi-agentes foram aplicados em fluxos de geração de texto e imagem, proporcionando maior confiabilidade e qualidade aos resultados.
Planner – Executor
O primeiro padrão implementado é o Planner-Executor, que funciona em duas etapas distintas. A cada nova solicitação de geração de conteúdo, um agente planejador é acionado para coletar e consolidar informações cruciais: detalhes sobre a oferta comercial, regras específicas estabelecidas pelo cliente e diretrizes dos provedores onde o material será publicado.
Este agente planejador processa todas essas informações e cria um plano estruturado. Este plano inclui critérios de qualidade e uma sequência lógica de execução que será seguida pelos agentes executores subsequentes. Uma vez definido o plano, ele é transmitido aos executores, que realizam as tarefas de geração de conteúdo de maneira adequada e coordenada.
Evaluator – Optimizer
A segunda camada de inteligência é representada pelo padrão Evaluator-Optimizer. Cada agente gerador de conteúdo possui um agente avaliador dedicado que atua como um crítico criterioso. Este avaliador examina os resultados produzidos, identifica possíveis erros, elabora feedbacks detalhados e, quando necessário, solicita a reexecução da tarefa.
Os agentes avaliadores operam com base em regras de qualidade específicas para cada cliente. Esta camada adicional de avaliação funciona como uma segunda linha de defesa nas pipelines de geração, reduzindo a quantidade de erros e a necessidade de ajustes posteriores pelos clientes finais. Com isso, a equipe consegue entregar resultados consistentes e alinhados às expectativas desde a primeira iteração.
Curator
O padrão mais sofisticado da arquitetura é o Curator, que resolve um dos maiores desafios na geração automatizada de conteúdo. Produzir textos de alta qualidade que atendam simultaneamente às exigências de compliance dos provedores, regras abstratas dos clientes e limites extremamente precisos de caracteres representa uma tarefa complexa até mesmo para os LLMs mais avançados.
Para superar essa limitação, ao final de cada fase de geração, um modelo especializado de curadoria reavalia todos os textos produzidos. A característica mais importante deste agente é sua capacidade única de realizar composições híbridas: ele pode identificar segmentos de texto de baixa qualidade gerados pelo agente A e substituí-los por trechos bem-sucedidos produzidos pelo agente B.
Este processo de curadoria inteligente proporciona uma variedade substancial de resultados finais, tornando os textos menos artificiais e mais naturais. A combinação de diferentes outputs dos agentes permite criar conteúdo que se aproxima da qualidade de material produzido por redatores humanos experientes, mantendo a eficiência e escalabilidade da automação.

Arquitetura AWS
A escolha da arquitetura serverless tem se mostrado fundamental para alcançar escalabilidade e flexibilidade na geração automatizada de conteúdo. Ao implementar agentes em funções AWS Lambda — serviço de computação serverless que executa código em resposta a eventos sem a necessidade de provisionar ou gerenciar servidores — a equipe garantiu uma capacidade de escala praticamente ilimitada para suas operações de geração.
A utilização do AWS Lambda permite que cada agente escale de forma independente e paralela, aproveitando toda a capacidade disponível na infraestrutura da nuvem. Esta arquitetura serverless elimina gargalos tradicionais de infraestrutura, já que o serviço pode executar milhares de instâncias simultâneas conforme a demanda aumenta, ajustando-se automaticamente ao volume de requisições.
Com essa capacidade de escala paralela, tornou-se possível aproveitar os pontos fortes de múltiplos provedores de inteligência artificial disponíveis no mercado. Com o apoio do Amazon Bedrock, a aplicação não depende de um único modelo ou provedor. A arquitetura permite orquestrar diversos serviços de IA simultaneamente, cada um contribuindo com suas características únicas.
A combinação de modelos curadores com a arquitetura multi-agente proporciona uma variedade de geração maior do que era possível com a arquitetura anterior. Esta abordagem permite explorar as especialidades de diferentes modelos de linguagem, maximizando a qualidade final do conteúdo produzido.
Por exemplo, os modelos GPT são reconhecidos por gerar textos com maior criatividade e fluidez narrativa, sendo ideais para conteúdos que exigem originalidade e engajamento. Por outro lado, os modelos Claude demonstram excelência em seguir regras específicas e diretrizes detalhadas, sendo mais precisos em tarefas que demandam compliance rigoroso e formatação exata.
Ao misturar estrategicamente esses diferentes provedores através dos agentes curadores, a solução consegue extrair o melhor dos dois mundos: a criatividade e naturalidade dos modelos GPT combinada com a precisão e confiabilidade dos modelos Claude. Este casamento de tecnologias, viabilizado pela escalabilidade do AWS Lambda, resulta em conteúdo de qualidade superior, mantendo tanto a criatividade quanto a aderência às regras estabelecidas pelos clientes e provedores de publicação. Na imagem abaixo, os fluxos na AWS são mostrados:

Resultados
A implementação da nova arquitetura multi-agentes baseada em serverless trouxe resultados que transformaram a capacidade de geração da plataforma, impactando qualidade, escalabilidade e velocidade da aplicação.
A velocidade de geração de material aumentou 4.7 vezes, impulsionada pelo processamento paralelo do AWS Lambda e pela orquestração eficiente dos múltiplos agentes. A capacidade de produção evoluiu de 720 para 3.360 textos por hora — um crescimento de 366% no throughput — permitindo atender volumes muito maiores sem degradação de qualidade.
O tempo total para produção de ofertas completas, envolvendo múltiplos componentes de texto e imagem, foi reduzido em 3 vezes. Esta aceleração representa um diferencial competitivo importante, permitindo que os clientes respondam mais rapidamente às oportunidades de mercado e ajustem campanhas com maior agilidade.
A combinação de velocidade, volume e qualidade posiciona a solução como uma ferramenta robusta e confiável para geração automatizada de conteúdo publicitário em escala empresarial.

Conclusão
Na Advolve, a abordagem combina conhecimento consolidado de arquitetura de software tradicional com inovações de pipelines multi-agentes, permitindo enfrentar desafios técnicos da IA generativa com maturidade e boas práticas estabelecidas.
A equipe está em constante aprendizado, construindo sistemas robustos capazes de lidar com complexidades técnicas — como latência variável, gerenciamento de contexto e orquestração de múltiplos modelos — e negociais, incluindo conformidade, personalização por cliente e garantias de qualidade rigorosas.
A experiência acumulada demonstra que a escalabilidade bem-sucedida de sistemas de IA depende da capacidade de integrar princípios fundamentais de engenharia de software com as particularidades dos modelos generativos modernos. O resultado é uma arquitetura preparada para evoluir com novas tecnologias, mantendo a robustez e confiabilidade que as operações empresariais demandam.
Autores
![]() |
João Paulo Martins, CTO – Advolve, possui mais de uma década na interseção de dados, IA e impacto no mundo real. Especializado em NLP e LLMs, criando sistemas inteligentes e escaláveis. Atualmente, lidera a Advolve como cofundador e CTO, revolucionando o marketing com automação orientada por IA. |
![]() |
Rafael Gonchor, Engenheiro de software – Advolve, engenheiro e arquiteto com mais de 20 anos de experiência na criação de produtos escaláveis — de aplicativos móveis a infraestrutura em nuvem e integrações de IA. Prospero na interseção entre engenharia e inovação de produtos. Fora do trabalho, gosta de jogos, leitura e tecnologias emergentes. |
![]() |
Phelipe Fabres, Sr. Arquiteto de Soluções – Generative AI – AWS. |


