Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Paul Graham
Paul Graham a repostat
Uneori este greu de înțeles semnificația raționamentului și a actualizărilor logice care încep să apară în modele puternice, cum ar fi GPT-5. Iată un exemplu *foarte simplu* despre cât de puternice devin aceste modele.
Am luat un document recent de transcriere a apelului NVIDIA care avea 23 de pagini și avea 7.800 de cuvinte. Am luat o parte din propoziția "și marja brută se va îmbunătăți și se va întoarce la mijlocul anilor '70" și am modificat "mijlocul anilor '70" la "mijlocul anilor '60".
Pentru un analist financiar acordat de la distanță, acest lucru ar părea deplasat, deoarece marjele nu s-ar "îmbunătăți și nu s-ar întoarce" la un număr mai mic decât cel descris ca un număr mai mare în altă parte. Dar probabil că 95% dintre cei care citesc acest comunicat de presă nu ar fi observat modificarea, deoarece se potrivește cu ușurință în celelalte 7.800 de cuvinte menționate.
Cu Box AI, testând o varietate de modele AI, am întrebat apoi o serie de modele "Există erori logice în acest document? Vă rugăm să oferiți un răspuns de o propoziție."
GPT-4.1, GPT4.1 mini și o mână de alte modele care erau de ultimă generație în urmă cu doar ~ 6 luni s-au întors în general și au returnat că nu există erori logice în document. Pentru aceste modele, documentul pare probabil coerent și urmează cum s-ar aștepta să arate o transcriere a câștigurilor, așa că nimic nu iese în evidență pentru ei cu privire la ce să acorde atenție - un fel de halucinație inversă.
GPT-5, pe de altă parte, a descoperit rapid problema și a răspuns cu:
"Da, documentul conține o inconsecvență internă în ceea ce privește orientarea marjei brute, la un moment dat spunând că marjele vor "reveni la mijlocul anilor '60" și mai târziu spunând că vor fi "la mijlocul anilor '70" mai târziu în acest an.
În mod uimitor, acest lucru s-a întâmplat cu GPT-5, GPT-5 mini și, în mod remarcabil, *chiar* GPT-5 nano. Rețineți că jetoanele de ieșire ale GPT-5 nano au un preț de 1/20 din jetoanele GPT-4.1. Deci, mai inteligent (în acest caz de utilizare) pentru 5% din cost.
Acum, deși revizuirea erorilor pe documentele de afaceri nu este adesea o întâmplare zilnică pentru fiecare lucrător din cunoștințe, aceste tipuri de probleme apar într-o varietate de moduri atunci când aveți de-a face cu seturi mari de date nestructurate, cum ar fi documente financiare, contracte, transcrieri, rapoarte și multe altele. Poate fi găsirea unui fapt, descoperirea unei erori logice, rularea unei ipoteze sau necesitatea unui raționament deductiv sofisticat.
Iar capacitatea de a aplica mai multă logică și raționament datelor întreprinderii devine deosebit de critică atunci când implementați agenți AI în întreprindere. Deci, este uimitor să vezi progresele în acest spațiu chiar acum, iar acest lucru va deschide o mulțime de cazuri de utilizare pentru companii.
105,99K
Cineva a întrebat cum să extindem ideile startup-urilor. Cel mai bun mod este să micșorați ideea până la esența ei, apoi să întrebați cât de larg ar putea fi extinsă acea idee esențială. Totuși, trebuie să-l micșorezi mai întâi, altfel vor rămâne lucruri aleatorii în el care îi împiedică expansiunea.
105,24K
Paul Graham a repostat
Găzduim un eveniment de inginerie contextuală în SF!
Aflați cum echipele de top de inteligență artificială aplicată își proiectează ferestrele de context. Ascultați de la:
Jake Heller, CEO @Casetext
Beyang Liu, CTO @Sourcegraph
Sam Bhagwat, CEO @Mastra_ai
Jeff Huber, CEO @trychroma
RSVP:

65,02K
Am întâlnit astăzi un fondator care a spus că scrie 10.000 de linii de cod pe zi datorită AI. Acesta este probabil cazul limită. Este un programator fierbinte, cunoaște foarte bine instrumentele AI și vorbește despre o zi de 12 ore. Dar nu este naiv. Acestea nu sunt 10.000 de rânduri de porcărie pline de insecte.
123,25K
Limită superioară
Clasament
Favorite
La modă pe lanț
La modă pe X
Principalele finanțări recente
Cele mai importante