O que é engenharia de prompt?

A engenharia de prompt é o processo em que você orienta as soluções de inteligência artificial generativa (IA generativa) para gerar os resultados desejados. Embora a IA generativa tente imitar os humanos, ela requer instruções detalhadas para criar resultados relevantes e de alta qualidade. Na engenharia de prompt, você escolhe os formatos, frases, palavras e símbolos mais adequados para orientar a IA a interagir com seus usuários de forma mais significativa. Os engenheiros de prompt usam a criatividade e tentativa e erro para criar uma coleção de textos de entrada, para que a IA generativa de uma aplicação funcione conforme o esperado.

O que é um prompt?

Um prompt é um texto em linguagem natural que solicita que a IA generativa execute uma tarefa específica. A IA generativa é uma solução de inteligência artificial que cria novos conteúdos, como histórias, conversas, vídeos, imagens e músicas. Ela é alimentada por modelos muito grandes de machine learning (ML) que usam as redes neurais profundas que foram pré-treinadas em grandes quantidades de dados.

Os grandes modelos de linguagem (LLMs) são muito flexíveis e podem realizar várias tarefas. Por exemplo, eles podem resumir documentos, completar frases, responder perguntas e traduzir idiomas. Para informações específicas do usuário, os modelos funcionam prevendo a melhor saída que eles determinam em treinamentos anteriores.

No entanto, por serem tão abertos, seus usuários podem interagir com as soluções de IA generativas por meio de inúmeras combinações de dados de entrada. Os modelos de linguagem de IA são muito poderosos e não exigem muito para começar a criar conteúdo. Até mesmo uma única palavra é suficiente para que o sistema crie uma resposta detalhada.

Apesar disso, nem todo tipo de entrada gera resultados úteis. Os sistemas de IA generativa exigem contexto e informações detalhadas para produzir respostas precisas e relevantes. Quando você cria prompts de forma sistemática, você obtém criações mais significativas e utilizáveis. Na engenharia de prompt, você refina continuamente os prompts até obter do sistema de IA os resultados desejados.

Leia sobre IA generativa »

Por que a engenharia de prompt é importante?

As tarefas da engenharia de prompt aumentaram significativamente desde o lançamento da IA generativa. Os engenheiros desse tipo de engenharia preenchem a lacuna entre os usuários finais e o grande modelo de linguagem. Eles identificam scripts e modelos que seus usuários podem personalizar e concluir para obter o melhor resultado dos modelos de linguagem. Esses engenheiros experimentam diferentes tipos de entradas para criar uma biblioteca de prompts que os desenvolvedores de aplicações podem reutilizar em diferentes cenários.

A engenharia de prompt torna as aplicações de IA mais eficientes e eficazes. Os desenvolvedores de aplicações normalmente encapsulam a entrada aberta do usuário em um prompt antes de passá-la para o modelo de IA.

Por exemplo, considere os chatbots de IA. Um usuário pode inserir uma declaração de problema incompleta, como “Onde comprar uma camisa.” Internamente, o código da aplicação usa um prompt desenvolvido que diz: “Você é assistente de vendas de uma empresa de roupas. Um usuário localizado no Alabama, Estados Unidos, está perguntando onde comprar uma camisa. Responda com as três lojas mais próximas que atualmente estocam camisas.” O chatbot então gera informações mais relevantes e precisas.

A seguir, discutiremos alguns benefícios da engenharia de prompt.

Maior controle para o desenvolvedor

A engenharia de prompt oferece aos desenvolvedores mais controle sobre as interações dos usuários com a IA. Prompts eficazes fornecem a intenção e estabelecem o contexto para os grandes modelos de linguagem. Eles ajudam a IA a refinar a saída e apresentá-la de forma concisa no formato necessário.

Eles também evitam que os usuários usem indevidamente a IA ou solicitem algo que a IA não saiba ou não possa manipular com precisão. Por exemplo, talvez você queira impedir que seus usuários gerem conteúdo impróprio em uma aplicação comercial de IA.

Melhor experiência do usuário

Os usuários evitam tentativas e erros e ainda recebem respostas coerentes, precisas e relevantes das ferramentas de IA. A engenharia de prompt facilita para que os usuários obtenham resultados relevantes já no primeiro prompt. Isso ajuda a mitigar a tendência que pode estar presente na tendência humana existente nos dados de treinamento dos grandes modelos de linguagem.

Além disso, ela aprimora a interação entre o usuário e a IA para que a IA entenda a intenção do usuário, mesmo com o mínimo de entrada. Por exemplo, solicitações para resumir um documento legal e um artigo de notícias obtêm resultados diferentes ajustados de acordo com o estilo e o tom. Isso é pertinente mesmo que os dois usuários simplesmente peçam à aplicação: “Resuma este documento.”

Maior flexibilidade

Níveis mais altos de abstração melhoram os modelos de IA e permitem que as organizações criem ferramentas mais flexíveis em grande escala. Um engenheiro pode criar prompts com instruções de domínio neutro, destacando links lógicos e padrões amplos. As organizações podem reutilizar rapidamente os prompts em toda a empresa para expandir seus investimentos em IA.

Por exemplo, para encontrar oportunidades de otimização de processos, o engenheiro de prompts pode criar solicitações diferentes que treinam o modelo de IA para encontrar ineficiências usando sinais amplos em vez de dados específicos do contexto. Os prompts podem então ser usados para diversos processos e unidades de negócios.

Quais são os casos de uso da engenharia de prompt?

As técnicas de engenharia de prompt são usadas em sistemas sofisticados de IA para melhorar a experiência do usuário com o modelo de linguagem de aprendizado. Veja alguns exemplos.

Especialistas no assunto

A engenharia de prompt desempenha um papel fundamental nas aplicações que exigem que a IA responda com expertise no assunto. Um engenheiro de prompt com experiência na área pode orientar a IA a referenciar as fontes corretas e estruturar a resposta de forma adequada com base na pergunta feita.

Por exemplo, na área médica, um médico pode usar um modelo de linguagem da engenharia de prompt para gerar diagnósticos diferenciais para um caso complexo. O profissional médico só precisa inserir os sintomas e os detalhes do paciente. A aplicação usa prompts criados pela engenharia para orientar a IA a primeiro listar as possíveis doenças associadas aos sintomas inseridos. Em seguida, ela restringe a lista com base nas informações adicionais do paciente.

Pensamento crítico

As aplicações de pensamento crítico exigem o modelo de linguagem para resolver problemas complexos. Para isso, o modelo analisa as informações de diferentes ângulos, avalia sua credibilidade e toma decisões fundamentadas. A engenharia de prompt aprimora os recursos de análise de dados de um modelo.

Por exemplo, em cenários de tomada de decisão, você pode solicitar que um modelo liste todas as opções possíveis, avalie cada opção e recomende a melhor solução.

Criatividade

A criatividade envolve a geração de novas ideias, conceitos ou soluções. A engenharia de prompt pode ser usada para aprimorar as habilidades criativas de um modelo em vários cenários.

Por exemplo, em cenários de escrita, um escritor pode usar um modelo de engenharia de prompt para ajudar a gerar ideias para uma história. O escritor pode solicitar que o modelo liste possíveis personagens, cenários e pontos da trama e, em seguida, desenvolver uma história com esses elementos. Em outro exemplo, um designer gráfico pode solicitar que o modelo gere uma lista de paletas de cores que evoquem uma certa emoção e, em seguida, crie um design usando essa paleta. 

O que são técnicas de engenharia de prompt?

A engenharia de prompt é um campo dinâmico e em evolução. São necessárias habilidades linguísticas e expressão criativa para ajustar os prompts e obter a resposta desejada das ferramentas de IA generativa.

Aqui estão alguns exemplos de técnicas que a engenharia de prompt usa para melhorar as tarefas de processamento de linguagem natural (PLN) dos modelos de IA.

Prompting com cadeia de pensamento

O prompting com cadeia de pensamento é uma técnica que separa uma questão complexa em partes menores e lógicas que imitam uma linha de pensamento. Isso ajuda o modelo a resolver problemas em uma série de etapas intermediárias, em vez de responder diretamente à pergunta. Isso aumenta a capacidade de raciocínio do modelo.

Você pode receber vários resultados em cadeia para tarefas complexas e pode optar pela conclusão mais comumente alcançada. Se todos os resultados discordarem significativamente, uma pessoa pode ser consultada para corrigir a cadeia de pensamento.

Por exemplo, se a pergunta for “Qual é a capital da França?” o modelo pode retornar vários resultados, levando a respostas como “Paris”, “A capital da França é Paris” e “Paris é a capital da França”. Como todos os resultados levam à mesma conclusão, “Paris” será selecionada como a resposta final.

Prompting da árvore de pensamento (ToT)

A técnica da árvore de pensamento generaliza o prompting da cadeia de pensamento. Ela solicita que o modelo gere as próximas etapas possíveis. Em seguida, ela executa o modelo em cada possível etapa seguinte usando um método de busca em árvore.

Por exemplo, se a pergunta for “Quais são os efeitos das mudanças climáticas?” o modelo pode primeiro gerar as próximas etapas possíveis, como “Listar os efeitos ambientais e “Listar os efeitos sociais”. Em seguida, ele poderia elaborar cada uma delas nas etapas subsequentes.

Prompting maiêutico

O prompting maiêutico é semelhante ao prompting da árvore de pensamento. É solicitado que o modelo responda a uma pergunta com uma explicação. O modelo é então solicitado a explicar partes da explicação. As explicações inconsistentes no modelo de árvore são podadas ou descartadas. Isso melhora o desempenho nos raciocínios complexos de senso comum.

Por exemplo, se a pergunta for “Por que o céu é azul?” o modelo pode primeiro responder: “O céu parece azul ao olho humano porque as ondas curtas de luz azul são espalhadas em todas as direções pelos gases e partículas na atmosfera da Terra.” Em seguida, ele pode expandir partes dessa explicação como, porque a luz azul é mais dispersa do que outras cores ou do que a atmosfera da Terra é composta.

Prompting baseado na complexidade

Essa técnica de engenharia rápida envolve o retorno de vários resultados da cadeia de pensamento. Ela escolhe os resultados com as cadeias de pensamento mais longas e, em seguida, escolhe a conclusão mais comumente alcançada.

Por exemplo, se a pergunta for um problema matemático complexo, o modelo poderá produzir vários resultados, cada um envolvendo várias etapas de cálculos. Ele consideraria os resultados com a maior cadeia de pensamento, o que, neste exemplo, seria o maior número de etapas de cálculos. Os resultados que chegassem a uma conclusão comum com outros resultados seriam selecionados como a resposta final.

Prompting de conhecimento gerado

Essa técnica envolve solicitar que o modelo gere primeiro os fatos relevantes necessários para concluir a solicitação. Em seguida, ele prossegue com a conclusão do prompt. Isso geralmente resulta em maior qualidade da conclusão, pois o modelo está condicionado a fatos relevantes.

Por exemplo, imagine que um usuário solicite que o modelo escreva um ensaio sobre os efeitos do desmatamento. O modelo pode primeiro gerar fatos como “o desmatamento contribui para a mudança climática” e “o desmatamento leva à perda de biodiversidade”. Em seguida, ele pode elaborar os pontos do ensaio.

Prompts to tipo menor para o maior

Nessa técnica de engenharia de prompt, é necessário que o modelo primeiro liste os subproblemas de um problema e depois o solucione. Essa abordagem garante que subproblemas posteriores possam ser resolvidos com a ajuda de respostas aos subproblemas anteriores.

Por exemplo, imagine que um usuário solicite ao modelo um problema matemático como “Resolva x na equação 2x + 3 = 11”. O modelo pode primeiro listar os subproblemas como “Subtraia 3 dos dois lados” e “Divida por 2”. Em seguida, ele pode resolvê-los em sequência para obter a resposta final.

Prompts de ajuste automático

Nessa técnica, o modelo é solicitado a resolver o problema, criticar a solução e, em seguida, solucionar o problema considerando o problema, a solução e a crítica. O processo de resolução de problemas se repete até atingir um motivo predeterminado para parar. Por exemplo, ele pode ficar sem tokens ou tempo, ou o modelo pode gerar um token de parada.

Por exemplo, imagine que um usuário solicite a uma modelo “Escreva um pequeno ensaio sobre literatura.” O modelo pode redigir um ensaio, criticá-lo por falta de exemplos específicos e reescrever o ensaio para incluir exemplos específicos. Esse processo pode se repetir até que o ensaio seja considerado satisfatório ou até que um critério de interrupção seja atendido.

Prompt de estímulo direcional

Essa técnica de engenharia de prompt inclui uma dica ou sugestão, como as palavras-chave desejadas, para orientar o modelo de linguagem a obter o resultado desejado.

Por exemplo, se a solicitação for escrever um poema sobre o amor, o engenheiro de prompt poderá criar sugestões que incluam “coração”, “paixão” e “eterno”. O modelo poderá dar a sugestão: “Escreva um poema sobre o amor que inclua as palavras 'coração', 'paixão' e 'eterno'.” Isso orientaria o modelo para criar um poema com essas palavras-chave.

Quais são as práticas recomendadas da engenharia de prompt?

Uma boa engenharia de prompt exige que você comunique as instruções com o contexto, o escopo e a resposta esperada. A seguir, compartilhamos algumas das práticas recomendadas.

Prompts inequívocos

Defina claramente a resposta desejada no prompt para evitar interpretações errôneas pela IA. Por exemplo, se você estiver solicitando um resumo de um romance, indique claramente que está procurando um resumo, não uma análise detalhada. Isso ajuda a IA a se concentrar apenas em sua solicitação e fornecer uma resposta alinhada ao seu objetivo.

Contexto adequado no prompt

Forneça um contexto adequado no prompt e inclua os requisitos do resultado na digitação do prompt, limitando-os a um formato específico. Por exemplo, digamos que você queira uma lista dos filmes mais populares da década de 1990 em uma tabela. Para obter o resultado exato, indique explicitamente quantos filmes deseja que sejam listados e solicite a formatação da tabela.

Equilíbrio entre as informações direcionadas e o resultado desejado

Equilibre simplicidade e complexidade em seu prompt para evitar respostas vagas, dissociadas ou inesperadas. Um prompt muito simples pode não ter contexto, enquanto um muito complexo pode confundir a IA. Isso é importante principalmente para tópicos complexos ou para a linguagem específica de um domínio, que podem ser menos familiares para a IA. Use uma linguagem simples e reduza o tamanho do prompt para tornar sua pergunta mais compreensível.

Experimente e refine o prompt

A engenharia de prompt é um processo iterativo. É essencial experimentar ideias diferentes e testar os prompts de IA para ver os resultados. Você pode precisar de várias tentativas para otimizar a precisão e a relevância. Testes e iterações contínuos reduzem o tamanho do prompt e ajudam o modelo a gerar melhores resultados. Não há regras fixas sobre como a IA gera informações, portanto, flexibilidade e adaptabilidade são essenciais.

Como a AWS pode atender os seus requisitos de IA generativa?

A Amazon Web Services (AWS) oferece uma grande variedade de ferramentas abrangentes para criar e usar a IA generativa. Por exemplo, você pode usar estes serviços:

  • Amazon CodeWhisperer para gerar sugestões de código que variam de trechos a funções completas em tempo real com base em seus comentários e no código existente.
  • Amazon Bedrock para acelerar o desenvolvimento de aplicações de IA generativa usando modelos de linguagem por meio de uma API, sem gerenciar a infraestrutura.
  • Amazon SageMaker JumpStart para descobrir, explorar e implantar modelos de linguagem de código aberto. Por exemplo, você pode trabalhar com modelos como OpenLLaMA, RedPajama, MPT-7B da MosaicML, FLAN-T5, GPT-NeoX-20B e BLOOM.

Se você preferir criar seus próprios modelos, use o Amazon SageMaker. Ele fornece infraestrutura e ferramentas gerenciadas para acelerar a criação, o treinamento e a implantação de modelos escaláveis, confiáveis e seguros.

Comece a usar a engenharia de prompt na AWS criando uma conta hoje mesmo.

Próximas etapas na AWS

Cadastre-se para obter uma conta gratuita

Obtenha acesso instantâneo ao nível gratuito da AWS.

Cadastre-se 
Comece a criar no console

Comece a criar no Console de Gerenciamento da AWS.

Faça login