Sí, esto parece haber sido correcto considerando el agente único frente a grok 4 con múltiples agentes pesados.
Jimmy Apples 🍎/acc
Jimmy Apples 🍎/acc11 jul 2025
Escucho algunos susurros ahora de los pájaros de que las evaluaciones internas están teniendo gpt5 un poco por encima de grok 4 Heavy. Sin embargo, las evaluaciones solo le dicen un lado a un modelo, curioso por ver si obtenemos mejoras importantes en el agente o de otro tipo.
24,18K