Você ouviu aqui primeiro: o GPT-5 estabelece um novo SOTA no FrontierMath (usando nossa estrutura pública, que usamos para avaliar modelos de todos os provedores). Com esforço de raciocínio médio e alto, o GPT-5 obteve 25% (±3%) no FrontierMath-2025-02-28-Private (ou seja, níveis 1-3).
3,54K