Du hörde det här först: GPT-5 etablerar en ny SOTA på FrontierMath (med hjälp av vår offentliga ställning, som vi använder för att utvärdera modeller från alla leverantörer). Med både medelhög och hög resonemangsansträngning fick GPT-5 25 % (±3 %) på FrontierMath-2025-02-28-Private (dvs. nivå 1-3).
3,74K