Lo escuchaste aquí primero: GPT-5 establece un nuevo SOTA en FrontierMath (usando nuestro andamiaje público, que utilizamos para evaluar modelos de todos los proveedores). Con un esfuerzo de razonamiento tanto medio como alto, GPT-5 obtuvo 25% (±3%) en FrontierMath-2025-02-28-Private (es decir, niveles 1-3).
3.54K