Vous l'avez entendu ici en premier : GPT-5 établit un nouveau SOTA sur FrontierMath (en utilisant notre échafaudage public, que nous utilisons pour évaluer les modèles de tous les fournisseurs). Avec un effort de raisonnement moyen et élevé, GPT-5 a obtenu 25 % (±3 %) sur FrontierMath-2025-02-28-Privé (c'est-à-dire les niveaux 1-3).
3,79K