Andrej Karpathy apoia a introdução de um novo termo relacionado à "engenharia de contexto" no desenvolvimento de software de IA usando LLMs. E esse termo há muito parece muito necessário. Toda vez que explico para as pessoas como desenvolvemos nosso Nethermind AuditAgent, um dos principais aspectos, além de usar expertise de domínio (segurança web3) e usar os melhores modelos de IA disponíveis (da OpenAI, Anthropic e Google), e ferramentas para LLM, é justamente "engenharia de contexto". Às vezes há uma expressão "o contexto é o rei", e isso realmente é verdade. Os LLMs, sejam grandes avançados ou pequenos LLMs otimizados, são uma ferramenta poderosa, mas, como qualquer ferramenta, se estiver nas mãos erradas, você obterá resultados muito menos promissores do que se trabalhasse com eles corretamente. E o gerenciamento de contexto (ou engenharia) é de fato uma área complexa e não muito bem descrita que está em constante evolução, e realmente surgiu como uma extensão do conceito de engenharia rápida, que já tem algumas conotações negativas. No geral, Andrej listou os principais aspectos relacionados à engenharia de contexto (na segunda captura de tela), mas em cada tarefa específica, as pessoas alcançam excelentes resultados em grande parte por tentativa e erro, cada vez tentando monotonamente selecionar os elementos de contexto corretos que são realmente necessários neste estágio de resolução de problemas, coletando benchmarks para cada estágio, olhando para métricas, dividindo conjuntos de dados em teste, validação, e assim por diante, e assim por diante. O que você acha da "engenharia de contexto"?
Andrej Karpathy
Andrej Karpathy25 de jun. de 2025
+1 para "engenharia de contexto" em vez de "engenharia rápida". As pessoas associam prompts a descrições curtas de tarefas que você daria a um LLM em seu uso diário. Quando em todos os aplicativos LLM de força industrial, a engenharia de contexto é a delicada arte e ciência de preencher a janela de contexto com as informações certas para a próxima etapa. Ciência porque fazer isso direito envolve descrições e explicações de tarefas, poucos exemplos de tiros, RAG, dados relacionados (possivelmente multimodais), ferramentas, estado e histórico, compactação... Muito pouco ou da forma errada e o LLM não tem o contexto certo para um desempenho ideal. Muito ou muito irrelevante e os custos de LLM podem subir e o desempenho pode diminuir. Fazer isso bem é altamente não trivial. E arte por causa da intuição orientadora em torno da psicologia LLM dos espíritos das pessoas. Além da engenharia de contexto em si, um aplicativo LLM precisa: - dividir os problemas em fluxos de controle - embale as janelas de contexto da maneira certa - enviar chamadas para LLMs do tipo e capacidade certos - lidar com fluxos UIUX de verificação de geração - muito mais - proteções, segurança, avaliações, paralelismo, pré-busca, ... Portanto, a engenharia de contexto é apenas uma pequena parte de uma camada espessa emergente de software não trivial que coordena chamadas LLM individuais (e muito mais) em aplicativos LLM completos. O termo "wrapper ChatGPT" está cansado e muito, muito errado.
449