Ora che GPT-5 è uscito, come pensi che me la sia cavata? Le mie previsioni per il modello erano corrette?
Matt Shumer
Matt Shumer15 apr 2024
Le mie previsioni sulle capacità di GPT-5: Dal meno interessante al più interessante: - lunghezza del contesto significativamente più lunga + capacità molto maggiore di utilizzarla in modo efficace (cioè capacità di ragionare attraverso aghi nei test di fieno) - molto più multimodale (sia in termini di numero di modalità che di quanto ‘profondo’ sia ciascuna) - output multimodali, anche se immagino che alcune modalità saranno disabilitate al lancio (sicurezza ecc. ecc.) - immagina di parlare direttamente con GPT-5, e lui risponde, senza usare Whisper o Voice Engine - breakthrough nel ragionamento Q* - Due modalità: ragionamento + normale — Q* potrebbe richiedere un tempo/costo di inferenza significativo, quindi a meno che non ci sia un breakthrough in efficienza, potrebbero anche offrire una modalità di risposta normale come vediamo oggi - Allo stesso modo, GPT-5 potrebbe avere una forma più avanzata di utilizzo computazionale/Q* adattivo… più difficile è la query, più potenza ci mette dietro per fornire una grande soluzione - capacità agentiche 10 volte migliori… agenti semplici/constratti saranno per lo più risolti, e ci avvicineremo molto di più a agenti generalisti nel mondo reale - capacità di tornare indietro — oltre alla riflessione, GPT-5 sarà in grado di riconoscere errori mentre risponde e correggere il corso - livelli pazzeschi di coerenza attraverso dati a lungo termine… inizieremo a pensare meno all'uso di sistemi separati per abilitare la memoria e più all'incorporamento di tutte le memorie nel prompt… questo spingerà anche gli agenti avanti - con questi ultimi tre punti, potrai lasciare GPT-5 da solo e fargli svolgere compiti complessi per te, e fidarti che li esegua correttamente senza dover controllare il suo lavoro - addestrato su un OOM di dati in più rispetto ai modelli precedenti, gran parte dei quali è stata raccolta da ChatGPT, pulita, migliorata, adattata ad altre modalità, ecc. - post-addestrato su dati *migliori* rispetto ai modelli attuali di punta - inizieremo a vedere scorci di capacità ben oltre ciò di cui parliamo oggi — ad esempio, avrà capacità più vicine all'uso per fare ricerca scientifica Cosa mi sono perso? Cosa ne pensi? Rispondi e fammi sapere.
6,43K