Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Uneori este greu de înțeles semnificația raționamentului și a actualizărilor logice care încep să apară în modele puternice, cum ar fi GPT-5. Iată un exemplu *foarte simplu* despre cât de puternice devin aceste modele.
Am luat un document recent de transcriere a apelului NVIDIA care avea 23 de pagini și avea 7.800 de cuvinte. Am luat o parte din propoziția "și marja brută se va îmbunătăți și se va întoarce la mijlocul anilor '70" și am modificat "mijlocul anilor '70" la "mijlocul anilor '60".
Pentru un analist financiar acordat de la distanță, acest lucru ar părea deplasat, deoarece marjele nu s-ar "îmbunătăți și nu s-ar întoarce" la un număr mai mic decât cel descris ca un număr mai mare în altă parte. Dar probabil că 95% dintre cei care citesc acest comunicat de presă nu ar fi observat modificarea, deoarece se potrivește cu ușurință în celelalte 7.800 de cuvinte menționate.
Cu Box AI, testând o varietate de modele AI, am întrebat apoi o serie de modele "Există erori logice în acest document? Vă rugăm să oferiți un răspuns de o propoziție."
GPT-4.1, GPT4.1 mini și o mână de alte modele care erau de ultimă generație în urmă cu doar ~ 6 luni s-au întors în general și au returnat că nu există erori logice în document. Pentru aceste modele, documentul pare probabil coerent și urmează cum s-ar aștepta să arate o transcriere a câștigurilor, așa că nimic nu iese în evidență pentru ei cu privire la ce să acorde atenție - un fel de halucinație inversă.
GPT-5, pe de altă parte, a descoperit rapid problema și a răspuns cu:
"Da, documentul conține o inconsecvență internă în ceea ce privește orientarea marjei brute, la un moment dat spunând că marjele vor "reveni la mijlocul anilor '60" și mai târziu spunând că vor fi "la mijlocul anilor '70" mai târziu în acest an.
În mod uimitor, acest lucru s-a întâmplat cu GPT-5, GPT-5 mini și, în mod remarcabil, *chiar* GPT-5 nano. Rețineți că jetoanele de ieșire ale GPT-5 nano au un preț de 1/20 din jetoanele GPT-4.1. Deci, mai inteligent (în acest caz de utilizare) pentru 5% din cost.
Acum, deși revizuirea erorilor pe documentele de afaceri nu este adesea o întâmplare zilnică pentru fiecare lucrător din cunoștințe, aceste tipuri de probleme apar într-o varietate de moduri atunci când aveți de-a face cu seturi mari de date nestructurate, cum ar fi documente financiare, contracte, transcrieri, rapoarte și multe altele. Poate fi găsirea unui fapt, descoperirea unei erori logice, rularea unei ipoteze sau necesitatea unui raționament deductiv sofisticat.
Iar capacitatea de a aplica mai multă logică și raționament datelor întreprinderii devine deosebit de critică atunci când implementați agenți AI în întreprindere. Deci, este uimitor să vezi progresele în acest spațiu chiar acum, iar acest lucru va deschide o mulțime de cazuri de utilizare pentru companii.
148,65K
Limită superioară
Clasament
Favorite