Presentiamo LLM Games 🕹️ di Ramp Labs Mettiamo a confronto GPT-5, Grok-4, o3, Gemini-2.5 e altri modelli per giocare a Connect Four. GPT-5 ha schiacciato tutti i modelli, vincendo 14/14 partite. Man mano che i giochi procedono, i modelli pensano molto più a lungo. Guarda le riproduzioni complete delle partite qui sotto.
27,08K