Después de probar gpt-5 durante las últimas varias horas, diré:
No puedo notar mucha diferencia entre él y o3.
Es un razonador constante, hasta donde puedo decir.
Podría parecer un modelo un poco más grande, pero más pequeño y no tan bueno como 4.5 en tareas que no se benefician del razonamiento.
Aún parece intentar dar respuestas cortas <8k.
Todavía tiene la misma personalidad de gpt, me he resignado a pensar que alguna vez saldrá de eso.
Las personas que leyeron las historias que escribió tuvieron opiniones mixtas.
Probablemente superará los benchmarks, pero no pude notar ninguna diferencia.
No tiene la sensación de "sin conocimiento, sin alma" que al menos tiene gpt-oss, pero menos que 4.5.
Se siente como un 4o completo, tal vez? Con un poco de sensación de 4.5, pero no del todo.
No sé, no puedo decir que se sienta como la diferencia entre 3.5 y 4 para mí, pero tal vez me sorprenda el livestream con algo que aún no he explorado sobre él.