Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 is gisteren gelanceerd. 94,6% op AIME 2025. 74,9% op SWE-bench.
Naarmate we de bovenste grenzen van deze benchmarks naderen, sterven ze.
Wat GPT-5 en de volgende generatie modellen revolutionair maakt, is niet hun kennis. Het is weten hoe te handelen. Voor GPT-5 gebeurt dit op twee niveaus. Ten eerste, beslissen welk model te gebruiken. Maar ten tweede, en belangrijker, door middel van tool-aanroepen.
We leven in een tijdperk waarin LLM's kennisretrieval en hersamenstelling hebben beheerst. Consumentenzoekopdrachten en codering, de aanvankelijke killer-applicaties, zijn fundamenteel uitdagingen in kennisretrieval. Beide organiseren bestaande informatie op nieuwe manieren.
We hebben die heuvels beklommen en als gevolg daarvan is de concurrentie intenser dan ooit. De modellen van Anthropic, OpenAI en Google komen steeds dichter bij vergelijkbare capaciteiten. Chinese modellen en open-source alternatieven blijven steeds dichter bij de state-of-the-art komen. Iedereen kan informatie ophalen. Iedereen kan tekst genereren.
De nieuwe as van concurrentie? Tool-aanroepen.
Tool-aanroepen transformeren LLM's van adviseurs naar acteurs. Het compenseert voor twee kritieke modelzwaktes die pure taalmodes niet kunnen overwinnen.
Ten eerste, workflow-orchestratie. Modellen excelleren in eenmalige reacties, maar hebben moeite met multi-stap, stateful processen. Tools stellen hen in staat om lange workflows te beheren, voortgang bij te houden, fouten af te handelen en context te behouden over tientallen operaties.
Ten tweede, systeemintegratie. LLM's leven in een tekst-only wereld. Tools stellen hen in staat om voorspelbaar te interfacing met externe systemen zoals databases, API's en bedrijfssoftware, waardoor natuurlijke taal wordt omgezet in uitvoerbare acties.
In de afgelopen maand heb ik 58 verschillende AI-tools gebouwd.
E-mailverwerkers. CRM-integrators. Notion-updaters. Onderzoeksassistenten. Elke tool breidt de mogelijkheden van het model uit naar een nieuw domein.
De belangrijkste capaciteit voor AI is het snel en correct selecteren van de juiste tool. Elke verkeerd gerouteerde stap doodt de hele workflow.
Wanneer ik zeg "lees deze e-mail van Y Combinator en vind alle startups die niet in de CRM staan," voeren moderne LLM's een complexe reeks uit.
Één commando in het Engels vervangt een hele workflow. En dit is slechts een eenvoudige.
Nog beter, het model, goed ingesteld met de juiste tools, kan zijn eigen werk verifiëren dat taken op tijd zijn voltooid. Deze zelfverificatiecyclus creëert betrouwbaarheid in workflows die anders moeilijk te bereiken is.
Vermenigvuldig dit over honderden werknemers. Duizenden workflows. De productiviteitswinsten stapelen zich exponentieel op.
De winnaars in de toekomstige AI-wereld zullen degenen zijn die het meest geavanceerd zijn in het orkestreren van tools en het routeren van de juiste queries. Elke keer. Zodra die workflows voorspelbaar zijn, zullen we allemaal agentmanagers worden.

3,19K
Boven
Positie
Favorieten