Vi presenterar LLM Games 🕹️ av Ramp Labs Vi ställer GPT-5, Grok-4, o3, Gemini-2.5 och andra modeller mot varandra för att spela Connect Four. GPT-5 high krossade alla modeller och vann 14/14 matcher. I takt med att spelen fortskrider tänker modellerna mycket längre. Se hela repriserna av spelen nedan.
27,09K