Você ouviu aqui primeiro: GPT-5 estabelece um novo SOTA no FrontierMath (usando nosso andaime público, que usamos para avaliar modelos de todos os provedores). Com esforço de raciocínio médio e alto, o GPT-5 obteve 25% (±3%) em FrontierMath-2025-02-28-Private (ou seja, níveis 1-3).
3,79K