Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Paul Graham
Paul Graham erneut gepostet
Es ist manchmal schwer, die Bedeutung der Aktualisierungen von Argumentation und Logik zu erfassen, die in leistungsstarken Modellen wie GPT-5 zu entstehen beginnen. Hier ist ein *sehr einfaches* Beispiel dafür, wie leistungsstark diese Modelle werden.
Ich habe ein aktuelles Transkript eines NVIDIA-Ergebnisgesprächs genommen, das 23 Seiten lang war und 7.800 Wörter hatte. Ich nahm einen Teil des Satzes "und die Bruttomarge wird sich verbessern und zurück in die mittleren 70er bewegen" und änderte "mittlere 70er" in "mittlere 60er".
Für einen finanziellen Analysten, der remote zugeschaltet ist, würde dies fehl am Platz wirken, da die Margen sich nicht "verbessern und zurückkehren" können zu einer niedrigeren Zahl als der, die anderswo als höhere Zahl beschrieben wird. Aber wahrscheinlich würden 95% der Personen, die diese Pressemitteilung lesen, die Änderung nicht bemerken, da sie sich leicht in die anderen 7.800 Wörter einfügt, die erwähnt werden.
Mit Box AI, bei dem verschiedene KI-Modelle getestet werden, fragte ich dann eine Reihe von Modellen: "Gibt es logische Fehler in diesem Dokument? Bitte geben Sie eine ein Satz Antwort."
GPT-4.1, GPT-4.1 mini und eine Handvoll anderer Modelle, die vor etwa 6 Monaten auf dem neuesten Stand waren, kamen im Allgemeinen zurück und gaben an, dass es keine logischen Fehler im Dokument gab. Für diese Modelle scheint das Dokument wahrscheinlich kohärent und folgt dem, was sie von einem Ergebnisprotokoll erwarten würden, sodass nichts wirklich heraussticht, worauf sie achten sollten - eine Art umgekehrte Halluzination.
GPT-5 hingegen entdeckte schnell das Problem und antwortete mit:
"Ja - das Dokument enthält eine interne Inkonsistenz bezüglich der Bruttomargenprognose, indem es an einer Stelle sagt, dass die Margen "in die mittleren 60er zurückkehren" und später sagt, dass sie "in den mittleren 70ern" später in diesem Jahr sein werden."
Erstaunlicherweise geschah dies mit GPT-5, GPT-5 mini und bemerkenswerterweise *sogar* mit GPT-5 nano. Beachten Sie, dass die Ausgabetoken von GPT-5 nano zu 1/20 des Preises der Tokens von GPT-4.1 angeboten werden. Also, intelligenter (in diesem Anwendungsfall) für 5% der Kosten.
Jetzt, während die Überprüfung von Fehlern in Geschäftsdokumenten nicht oft eine tägliche Angelegenheit für jeden Wissensarbeiter ist, treten diese Arten von Problemen auf verschiedene Weise auf, wenn man mit großen unstrukturierten Datensätzen arbeitet, wie Finanzdokumenten, Verträgen, Transkripten, Berichten und mehr. Es kann darum gehen, eine Tatsache zu finden, einen logischen Fehlschluss herauszufinden, ein hypothetisches Szenario zu durchspielen oder anspruchsvolle deduktive Schlussfolgerungen zu ziehen.
Und die Fähigkeit, mehr Logik und Argumentation auf Unternehmensdaten anzuwenden, wird besonders kritisch, wenn KI-Agenten im Unternehmen eingesetzt werden. Es ist also erstaunlich, die Fortschritte in diesem Bereich gerade jetzt zu sehen, und das wird eine Menge weiterer Anwendungsfälle für Unternehmen eröffnen.
129,49K
Jemand fragte, wie man die Ideen von Startups erweitern kann. Der beste Weg ist, die Idee auf ihr Wesentliches zu reduzieren und dann zu fragen, wie weit diese essentielle Idee ausgeweitet werden könnte. Man muss sie zuerst verkleinern, sonst bleibt zufälliger Kram übrig, der ihre Erweiterung behindert.
105,25K
Ich habe heute einen Gründer getroffen, der sagte, dass er dank KI 10.000 Zeilen Code pro Tag schreibt. Das ist wahrscheinlich der Extremfall. Er ist ein herausragender Programmierer, kennt sich sehr gut mit KI-Tools aus und spricht von einem 12-Stunden-Tag. Aber er ist nicht naiv. Das sind keine 10.000 Zeilen voller Bugs.
123,25K
Top
Ranking
Favoriten
Onchain-Trends
Im Trend auf X
Aktuelle Top-Finanzierungen
Am bemerkenswertesten