Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Steven Sinofsky
Steven Sinofsky heeft opnieuw gepost
Het is soms moeilijk om de betekenis van de redenering en logica-updates die beginnen op te duiken in krachtige modellen, zoals GPT-5, te begrijpen. Hier is een *heel eenvoudig* voorbeeld van hoe krachtig deze modellen worden.
Ik nam een recent transcript van een NVIDIA-verdiencall dat 23 pagina's lang was en 7.800 woorden bevatte. Ik nam een deel van de zin "en de brutomarge zal verbeteren en terugkeren naar de midden-70s" en wijzigde "midden-70s" naar "midden-60s".
Voor een op afstand ingeschakelde financiële analist zou dit uit de toon vallen, omdat de marges niet "verbeteren en terugkeren" naar een lager nummer dan het nummer dat elders als een hoger nummer wordt beschreven. Maar waarschijnlijk zou 95% van de mensen die deze persverklaring lezen de wijziging niet hebben opgemerkt, omdat het gemakkelijk past in de andere 7.800 woorden die worden genoemd.
Met Box AI, terwijl ik een verscheidenheid aan AI-modellen testte, vroeg ik een reeks modellen: "Zijn er logische fouten in dit document? Geef een antwoord in één zin."
GPT-4.1, GPT4.1 mini, en een handvol andere modellen die ongeveer 6 maanden geleden state-of-the-art waren, kwamen over het algemeen terug en gaven aan dat er geen logische fouten in het document waren. Voor deze modellen lijkt het document waarschijnlijk coherent en volgt het wat zij zouden verwachten dat een verdienstranscript eruit zou zien, dus valt er voor hen niets echt op om op te letten - een soort omgekeerde hallucinatie.
GPT-5 daarentegen ontdekte snel het probleem en reageerde met:
"Ja - het document bevat een interne inconsistentie over de brutomarge-voorspelling, waarbij op een gegeven moment wordt gezegd dat de marges "terug zullen keren naar de midden-60s" en later wordt gezegd dat ze "in de midden-70s" zullen zijn later dit jaar."
Verbazingwekkend genoeg gebeurde dit met GPT-5, GPT-5 mini, en, opmerkelijk, *zelfs* GPT-5 nano. Houd er rekening mee dat de outputtokens van GPT-5 nano geprijsd zijn op 1/20 van de tokens van GPT-4.1. Dus, intelligenter (voor deze use-case) voor 5% van de kosten.
Nu, hoewel het doen van foutcontroles op zakelijke documenten niet vaak een dagelijkse bezigheid is voor elke kenniswerker, komen dit soort problemen op verschillende manieren naar voren bij het omgaan met grote ongestructureerde datasets, zoals financiële documenten, contracten, transcripties, rapporten en meer. Het kan gaan om het vinden van een feit, het uitzoeken van een logische drogreden, het uitvoeren van een hypothetische situatie, of het vereisen van geavanceerde deductieve redenering.
En het vermogen om meer logica en redenering toe te passen op bedrijfsdata wordt vooral kritisch wanneer AI-agents in de onderneming worden ingezet. Het is dus geweldig om de vooruitgang in deze ruimte op dit moment te zien, en dit gaat een heleboel nieuwe use-cases voor bedrijven openen.
148,64K
1/2 Een van de meest beledigende aspecten van hoe verrassingsbelastingen worden toegevoegd in uniparty-steden, is hoe ze opzettelijk "nep-toewijzingen" van geld voor specifieke doelen creëren, zodat het tegenwerken van een belastingverhoging betekent dat je tegen ziekenhuizen, scholen, daklozen, enz. bent.
Geld is vervangbaar. Verantwoording zou dat niet moeten zijn.

2,03K
Steven Sinofsky heeft opnieuw gepost
💥 Het is hier! GPT-5 wordt uitgerold in ChatGPT voor iedereen, beginnend vandaag.
Het is een 🤯 goed model, en we hebben de gebruikersinterface vereenvoudigd. Geen keuze meer tussen gpt-4o en o4-mini. Wanneer je een moeilijke vraag stelt en het model hard moet nadenken, doet het dat. Wanneer het je snel een antwoord kan geven, doet het dat.
Het is een ongelooflijke schrijver, programmeur, denkpartner, leraar, gezondheidsadviseur, assistent en nog veel meer.
Het is het beste wat we ooit hebben gebouwd, en ik kan niet wachten om te zien wat je ervan vindt.
39,11K
Steven Sinofsky heeft opnieuw gepost
Bedankt aan @joesquawk en @andrewsorkin dat ik vanochtend op @squawkcnbc mocht zijn om te praten over hoe we de cultuur van de federale arbeidskrachten gaan veranderen, zodat operationele efficiëntie een standaard wordt voor alles wat we doen namens de Amerikaanse belastingbetaler.
8,48K
Steven Sinofsky heeft opnieuw gepost
Dit is het actieplan
1) te veel uitgeven en belastinggeld verspillen
2) een noodsituatie verklaren die je dwingt om belastingen te verhogen
3) een belasting ontwerpen die alleen "de rijken" raakt — in dit geval grotere bedrijven
4) je deugdzaamheid signaleren door te benadrukken hoe je de kleine man helpt — in dit geval bedrijven met minder dan $2 miljoen omzet
5) opscheppen over hoe dit de kleine man zal helpen groeien
6) kijken hoe de kleine man zich realiseert dat als ze boven de $2 miljoen omzet groeien, ze met de nieuwe belasting worden geconfronteerd
7) dan kijken hoe grote bedrijven de stad verlaten
8) uiteindelijk kijken hoe kleine bedrijven, die afhankelijk waren van klanten die voor de grote bedrijven werkten, beginnen te sluiten en failliet gaan
9) geschokt doen wanneer de helft van de stadsbedrijven failliet gaat en gebouwen leeg staan
10) nog geschokter doen wanneer criminaliteit en dakloosheid de pan uit rijzen in uitgeholde winkelgebieden
11) de volgende noodsituatie verklaren die alleen kan worden opgelost door de belastingen op de kleine resterende bedrijven te verhogen…
12) herhalen
26,93K
Boven
Positie
Favorieten
Populair op onchain
Populair op X
Recente topfinanciering
Belangrijkste