Questo è sempre stato il benchmark più informativo riguardo alla traiettoria a medio termine degli LLM: quali sono le esperienze degli esperti del settore nel tentativo di applicare questi modelli a problemi relativamente complessi? Se hai seguito questa domanda, nulla di GPT-5 dovrebbe sorprenderti.
673