Tak, wydaje się, że to było słuszne, biorąc pod uwagę pojedynczego agenta w porównaniu do grok 4 ciężkiego wieloagenta.
Jimmy Apples 🍎/acc
Jimmy Apples 🍎/acc11 lip 2025
Słyszę teraz kilka szeptów od ptaków, że wewnętrzne oceny mają gpt5 trochę lepsze od grok 4 Heavy. Oceny pokazują tylko jedną stronę modelu, jednak jestem ciekaw, czy zobaczymy jakieś znaczące poprawy agentowe lub inne.
24,19K