Sie haben es hier zuerst gehört: GPT-5 setzt einen neuen SOTA auf FrontierMath (unter Verwendung unseres öffentlichen Gerüsts, das wir zur Bewertung von Modellen aller Anbieter nutzen). Mit sowohl mittlerem als auch hohem Denkaufwand erzielte GPT-5 25% (±3%) auf FrontierMath-2025-02-28-Private (d.h. Stufen 1-3).
3,53K