DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Kirill Balakhonov | Nethermind

Maker van AuditAgent | AI x Crypto x Product | Agentische economie opbouwen

Waarom heeft OpenAI modellen met open gewichten vrijgegeven? Om hun eigen bedrijf te killen... (of niet?) Ja, @OpenAI heeft zojuist twee modellen met open gewichten vrijgegeven, wat betekent dat ontwikkelaars ze kunnen gebruiken zonder OpenAI iets te betalen. Specifiek is het vrijgegeven onder de meest liberale commerciële Apache 2.0-licentie. Dus waarom heeft OpenAI dit gedaan? Er zijn verschillende aspecten. Maar ik wil verduidelijken dat wanneer een bedrijf een model met open gewichten vrijgeeft, dit niet betekent dat het model net zo open-source is als open-source code die je zelf kunt draaien, zoals het @Linux-besturingssysteem. Nee, met AI-modellen is het een beetje anders. In het bijzonder is een model een black box, een set gewichten. En hoewel je het op verschillende taken kunt testen en kunt zien hoe het werkt, als je het trainingsproces niet kunt reproduceren, zul je nooit weten of er achterdeurtjes of beveiligingskwetsbaarheden zijn die opzettelijk of per ongeluk in dit model zijn beland. Dus laten we dit meteen scheiden van open source. Helaas kunnen modellen met open-source gewichten niet volledig worden vertrouwd (ze kunnen echter goedkoop zijn). Het andere aspect dat ik opmerkte, zoals te zien is op de afbeelding, is dat de kwaliteit van open-source modellen niet veel verschilt van de vlaggenschipmodellen van OpenAI die alleen via API beschikbaar zijn. Dit is geweldig! Dit is onverwacht! Je zou denken hoeveel geld OpenAI zou kunnen verliezen door ontwikkelaars hun modellen te laten gebruiken? Echter, dit is niet alles. Modellen zijn niet alles wat je krijgt wanneer je OpenAI via API gebruikt. Bijvoorbeeld, wanneer je ChatGPT via de UI gebruikt en het o3-model kiest, is er eigenlijk een complexe agent die op de achtergrond werkt die, terwijl deze modellen worden gebruikt, veel logica heeft geschreven om echt goed samen te werken met jouw documenten en tools. Je krijgt er geen toegang toe via deze modellen die OpenAI heeft gepubliceerd. Dus waarom heeft OpenAI modellen met open gewichten vrijgegeven? Ten eerste hebben hun belangrijkste concurrenten, met name @Meta, @MistralAI en @deepseek_ai (oh, en @Google), al concurrerende modellen met open gewichten vrijgegeven die mensen gebruiken. En de populariteit van OpenAI onder mensen die open modellen gebruiken, groeit niet. Echter, voor ontwikkelaars die zowel modellen met open gewichten (voor lokale/private berekeningen) als API-toegankelijke modellen (voor moeilijkere dingen) nodig hebben, als ze beide nodig hebben, kunnen ze simpelweg OpenAI niet gebruiken. Het is gemakkelijker voor hen om hun concurrenten zoals Google of DeepSeek te gebruiken. Ten tweede is er aanzienlijke druk van zowel gebruikers als regelgevers die meer openheid willen. Mensen maken zich zorgen dat AI uit de hand kan lopen of onder controle kan komen van een smalle groep bedrijven in Silicon Valley, en mensen willen meer transparantie. Hoewel ik durf te zeggen dat zelfs alleen al de bezorgdheid over concurrentie en dalende verkopen, zo'n stap naar openheid waarschijnlijk OpenAI's bedrijf nog groter zal maken. En ten derde is er natuurlijk de grap over de bedrijfsnaam van OpenAI. Afgaande op hoe alles zich heeft ontwikkeld, was het bedrijf genaamd OpenAI het meest gesloten AI-bedrijf onder de leiders. Dit is op zich al grappig, maar nu is dit veranderd. Wat denk jij?

Andrej Karpathy ondersteunt de introductie van een nieuwe term gerelateerd aan "context engineering" in de ontwikkeling van AI-software met behulp van LLM's. En deze term lijkt al lange tijd zeer noodzakelijk. Elke keer als ik mensen uitleg hoe we onze Nethermind AuditAgent ontwikkelen, is een van de belangrijkste aspecten, naast het gebruik van domeinexpertise (web3-beveiliging) en het gebruik van de beste beschikbare AI-modellen (van OpenAI, Anthropic en Google), en tools voor LLM, precies "context engineering". Er is soms een uitdrukking "context is koning," en dat is echt waar. LLM's, of ze nu enorme geavanceerde zijn of geoptimaliseerde kleine LLM's, zijn een krachtig hulpmiddel, maar zoals elk hulpmiddel, als het in de verkeerde handen is, krijg je veel minder veelbelovende resultaten dan je zou kunnen krijgen als je er correct mee werkt. En contextbeheer (of engineering) is inderdaad een complex en niet erg goed beschreven gebied dat voortdurend evolueert, en het is echt ontstaan als een uitbreiding van het concept van prompt engineering, dat al enkele negatieve connotaties heeft. Over het algemeen heeft Andrej de belangrijkste aspecten gerelateerd aan context engineering opgesomd (op de tweede screenshot), maar in elke specifieke taak behalen mensen uitstekende resultaten grotendeels door trial and error, elke keer monotoon proberen de juiste contextelementen te selecteren die echt nodig zijn in deze fase van probleemoplossing, benchmarks verzamelen voor elke fase, kijken naar metrics, datasets verdelen in test-, validatie- enzovoort, en ga zo maar door. Wat vind je van "context engineering"?

Boven

Positie

Favorieten

Populair op onchain

Populair op X

Recente topfinanciering

Belangrijkste