Lo hai sentito qui per primo: GPT-5 stabilisce un nuovo SOTA su FrontierMath (utilizzando il nostro scaffold pubblico, che usiamo per valutare i modelli di tutti i fornitori). Con uno sforzo di ragionamento sia medio che alto, GPT-5 ha ottenuto 25% (±3%) su FrontierMath-2025-02-28-Private (cioè i livelli 1-3).
3,74K