Ja detta verkar ha varit rätt med tanke på Single agent vs grok 4 heavy multi agent
Jimmy Apples 🍎/acc
Jimmy Apples 🍎/acc11 juli 2025
Hör nu några viskningar från fåglar att inre evals har gpt5 en smula över grok 4 Heavy. Evals berättar bara en sida av en modell dock, nyfiken på att se om vi får några större agentiska eller andra förbättringar.
24,15K