Acum că GPT-5 a fost lansat, cum credeți că am făcut-o? Au fost corecte predicțiile mele pentru model?
Matt Shumer
Matt Shumer15 apr. 2024
Previziunile mele pentru capabilitățile GPT-5: De la cel mai puțin la cel mai interesant: - lungime semnificativ mai mare a contextului + capacitate mult mai mare de a-l folosi eficient (adică capacitatea de a raționa peste ace în testele carului cu fân) - mult mai multimodal (atât în ceea ce privește # de modalități, cât și cât de "adâncă" merge fiecare) - ieșiri multimodale, deși cred că unele modalități vor fi dezactivate la lansare (siguranță etc. etc.) - imaginați-vă că vorbiți direct cu GPT-5 și răspunde, fără a folosi Whisper sau Voice Engine - Descoperirea raționamentului Q* - Două moduri: raționament + normal — Q* poate necesita timp/cost semnificativ de inferență, așa că, dacă nu există o descoperire a eficienței, acestea pot oferi și un mod de răspuns normal, așa cum vedem astăzi - În mod similar, GPT-5 poate avea o formă mai avansată de utilizare adaptivă a calculului/Q*... Cu cât interogarea este mai grea, cu atât pune mai multă putere în spatele ei pentru a oferi o soluție excelentă - Capacități agentice de 10 ori mai bune... agenții simpli / constrânsi vor fi în mare parte rezolvați și ne vom apropia mult mai mult de agenții generaliști din lumea reală - capacitatea de a da înapoi - dincolo de reflecție, GPT-5 va fi capabil să recunoască greșelile pe măsură ce răspunde și să corecteze cursul - niveluri nebunești de coerență între datele pe termen lung... Vom începe să ne gândim mai puțin la utilizarea sistemelor separate pentru a activa memoria și mai mult la încorporarea tuturor amintirilor în prompt... Acest lucru va împinge agenții înainte - cu aceste ultime trei puncte, veți putea lăsa GPT-5 în pace și îi veți lăsa sarcini complexe și veți avea încredere că le face corect fără a fi nevoie să-i verificați activitatea - antrenat pe un OOM mai multe date decât modelele anterioare, dintre care multe sunt colectate din ChatGPT, curățate, îmbunătățite, transmise la alte modalități etc. - post-antrenat pe date mult *mai bune* decât modelele actuale - Vom începe să vedem sclipiri de capabilități mult dincolo de ceea ce vorbim astăzi - de exemplu, va avea abilități mai apropiate de cele utilizabile pentru a face cercetare științifică Ce am ratat? Ce crezi? Răspunde și spune-mi.
6,46K