LcStudy: > øver på å slå menneskelignende sjakkmotorer > ved å forutsi Leelas beste trekk > spore fremgang over tid > destillere AlphaZero-lignende sjakk inn i hjernen din Dette prosjektet var min Claude Code vs GPT5 Eval; Tanker nedenfor
Åpenbart er jeg motivert til å rose GPT5, men jeg skal prøve å holde dette objektivt (og jeg har noen nits / ting Claude Code gjør bedre)
1. GPT5 er mer nøyaktig enn Opus Mens massevis av ting gjør agenter gode utover nøyaktighet (dvs. byrå, å vite når du skal stille spørsmål, kommunikasjon osv.), gjør GPT5 bare færre feil enn Opus. føles som om den har flere "hestekrefter"
2. Claude Code er mer polert på måter Claude Code er noe renere enn Codex CLI (dvs. penere terminaloppsett, bedre kommandotrunkering, lesbarhet), men bare de siste tre dagene har følelsen av CLI forbedret seg massevis. neste uke blir enda bedre
3. GPT5 er styrbar; Opus er meningsfylt Jeg synes GPT5 er mer bokstavelig, men bedre til å følge instruksjoner. Det gir kanskje ikke stil med mindre du spør, men det vil ikke unødvendig slette filer uten å spørre. Jeg foretrekker generelt dette, men noen ganger går Opus bare av og forskjønner hjelpsomt
4. GPT5 har mer utholdenhet Jeg er mest overrasket over GPT5s klare SOTA-utholdenhet (noe Claude har vært god på). Jeg oppfordrer alle som bruker GPT5 til å prøve å være 100 ganger mer ambisiøse enn de trodde var mulig. den *kan* virkelig takle dagslange redigeringer
1,96K