Du hørte det her først: GPT-5 etablerer en ny SOTA på FrontierMath (ved å bruke vårt offentlige stillas, som vi bruker til å evaluere modeller fra alle leverandører). Med både middels og høy resonnementinnsats fikk GPT-5 25 % (±3 %) på FrontierMath-2025-02-28-Private (dvs. nivå 1-3).
3,73K