DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Kirill Balakhonov | Nethermind

Skapare av AuditAgent | AI x Crypto x Produkt | Att bygga en agentisk ekonomi

Varför släppte OpenAI modeller med öppna vikter? Att ta död på sin egen verksamhet... (eller inte?) Ja, @OpenAI precis släppt två modeller med öppna vikter, vilket innebär att utvecklare kan använda dem utan att betala OpenAI något. Specifikt släpps den under den mest liberala kommersiella Apache 2.0-licensen. Så varför gjorde OpenAI detta? Det finns flera aspekter. Men jag vill förtydliga att när ett företag släpper en modell med öppna vikter betyder det inte att modellen är lika öppen källkod som öppen källkod som du kan köra själv, som @Linux operativsystem. Nej, med AI-modeller är det lite annorlunda. I synnerhet är en modell en svart låda, en uppsättning vikter. Och även om du kan testa den på olika uppgifter och se hur den fungerar, om du inte kan återskapa träningsprocessen kan du aldrig veta om det finns några bakdörrar eller säkerhetsbrister som avsiktligt eller oavsiktligt hamnade i den här modellen. Så låt oss separera detta från öppen källkod direkt. Tyvärr kan man inte helt lita på modeller med öppen källkod (de kan dock vara chep). Den andra aspekten jag märkte, som visas på bilden, är att kvaliteten på modeller med öppen källkod inte skiljer sig särskilt mycket från OpenAI:s flaggskeppsmodeller som endast är tillgängliga via API. Det här är fantastiskt! Detta är oväntat! Man skulle kunna tänka sig hur mycket pengar OpenAI skulle kunna förlora på att låta utvecklare använda deras modeller? Detta är dock inte allt. Modeller är inte allt du får när du använder OpenAI via API. När du till exempel använder ChatGPT via UI och väljer o3-modellen finns det faktiskt en komplex agent som arbetar under huven som, när du använder dessa modeller, har massor av logik skriven ovanpå för att verkligen fungera bra med dina dokument och verktyg. Du kommer inte åt dem via dessa modeller som OpenAI publicerat. Så varför släppte OpenAI modeller med öppna vikter? För det första har deras huvudkonkurrenter, särskilt @Meta, @MistralAI och @deepseek_ai (och @Google), redan släppt konkurrenskraftiga modeller med öppna vikter som folk använder. Och OpenAI:s popularitet bland människor som använder öppna modeller växer inte. Men för utvecklare som behöver båda modellerna med öppna vikter (för lokala/privata beräkningar) tillsammans med API-tillgängliga modeller (för svårare saker), om de behöver båda, kan de helt enkelt inte använda OpenAI. Det är lättare för dem att använda sina konkurrenter som Google eller DeepSeek. För det andra finns det ett betydande tryck från både användare och tillsynsmyndigheter som vill ha mer öppenhet. Människor är oroliga för att AI kan komma att gå överstyr eller hamna under kontroll av en smal grupp företag i Silicon Valley, och människor vill ha mer transparens. Även om jag vågar säga att även om jag bara oroar mig för konkurrens och minskande försäljning, kommer en sådan rörelse mot öppenhet sannolikt att göra OpenAI:s verksamhet ännu större. Och för det tredje har vi förstås skämtet om OpenAI:s företagsnamn. Att döma av hur allt utvecklades var företaget som heter OpenAI det mest slutna AI-företaget bland ledarna. Det är lustigt i sig, men nu har det blivit ändring på det. Vad tror du?

Andrej Karpathy stöder introduktionen av en ny term relaterad till "kontextteknik" inom AI-programvaruutveckling med hjälp av LLM:er. Och den här termen har länge verkat mycket nödvändig. Varje gång jag förklarar för människor hur vi utvecklar vår Nethermind AuditAgent är en av de viktigaste aspekterna, förutom att använda domänexpertis (web3-säkerhet) och med hjälp av de bästa tillgängliga AI-modellerna (från OpenAI, Anthropic och Google), och verktyg för LLM, just "context engineering". Det finns ibland ett uttryck som säger att "sammanhanget är kungen", och det är verkligen sant. LLM:er, oavsett om de är stora avancerade eller optimerade små LLM:er, är ett kraftfullt verktyg, men som alla verktyg, om det är i fel händer, får du mycket mindre lovande resultat än du skulle kunna om du arbetar med dem på rätt sätt. Och context management (eller teknik) är verkligen ett komplext och inte särskilt väl beskrivet område som ständigt utvecklas, och det uppstod verkligen som en förlängning av konceptet med snabb teknik, som redan har vissa negativa konnotationer. Sammantaget listade Andrej de viktigaste aspekterna relaterade till kontextteknik (på den andra skärmdumpen), men i varje specifik uppgift uppnår människor utmärkta resultat till stor del genom försök och misstag, varje gång monotont försöker de välja rätt kontextelement som verkligen behövs i detta skede av problemlösning, samla in riktmärken för varje steg, titta på mätvärden, dela upp datauppsättningar i test, validering och så vidare, och så vidare. Vad tycker du om "context engineering"?

Topp

Rankning

Favoriter

Trendande på kedjan

Trendande på X

Senaste toppfinansieringarna

Mest anmärkningsvärda