GPT-5 lançado ontem. 94,6% no AIME 2025. 74,9% na bancada SWE. À medida que nos aproximamos dos limites superiores desses benchmarks, eles morrem. O que torna o GPT-5 e a próxima geração de modelos revolucionários não é o conhecimento deles. É saber como agir. Para GPT-5, isso acontece em dois níveis. Primeiro, decidir qual modelo usar. Mas segundo, e mais importante, por meio da chamada de ferramentas. Vivemos em uma era em que os LLMs dominam a recuperação e remontagem do conhecimento. A pesquisa e a codificação do consumidor, as aplicações matadoras iniciais, são fundamentalmente desafios de recuperação de conhecimento. Ambos organizam as informações existentes de novas maneiras. Subimos essas colinas e, como resultado, a competição está mais intensa do que nunca. Os modelos da Anthropic, OpenAI e Google estão convergindo para recursos semelhantes. Os modelos chineses e as alternativas de código aberto continuam a se aproximar cada vez mais do estado da arte. Todos podem recuperar informações. Todos podem gerar texto. O novo eixo da competição? Chamada de ferramentas. A chamada de ferramentas transforma os LLMs de consultores em atores. Ele compensa duas fraquezas críticas do modelo que os modelos de linguagem pura não podem superar. Primeiro, orquestração de fluxo de trabalho. Os modelos se destacam em respostas únicas, mas lutam com processos com várias etapas e com estado. As ferramentas permitem que eles gerenciem fluxos de trabalho longos, acompanhando o progresso, lidando com erros, mantendo o contexto em dezenas de operações. Em segundo lugar, integração do sistema. Os LLMs vivem em um mundo apenas de texto. As ferramentas permitem que eles interajam de forma previsível com sistemas externos, como bancos de dados, APIs e software corporativo, transformando a linguagem natural em ações executáveis. No último mês, construí 58 ferramentas de IA diferentes. Processadores de e-mail. Integradores de CRM. Atualizadores de noção. Assistentes de pesquisa. Cada ferramenta estende os recursos do modelo para um novo domínio. O recurso mais importante para a IA é selecionar a ferramenta certa de forma rápida e correta. Cada etapa mal direcionada mata todo o fluxo de trabalho. Quando digo "leia este e-mail da Y Combinator e encontre todas as startups que não estão no CRM", os LLMs modernos executam uma sequência complexa. Um comando em inglês substitui todo um fluxo de trabalho. E este é apenas um simples. Melhor ainda, o modelo, devidamente configurado com as ferramentas certas, pode verificar seu próprio trabalho se as tarefas foram concluídas no prazo. Esse loop de autoverificação cria confiabilidade em fluxos de trabalho que é difícil de alcançar de outra forma. Multiplique isso por centenas de funcionários. Milhares de fluxos de trabalho. Os ganhos de produtividade aumentam exponencialmente. Os vencedores no futuro mundo da IA serão aqueles que forem mais sofisticados em orquestrar ferramentas e rotear as consultas certas. Todas as vezes. Quando esses fluxos de trabalho forem previsíveis, todos nos tornaremos gerentes de agentes.
3,19K