介绍 Ramp Labs 的 LLM 游戏 🕹️ 我们让 GPT-5、Grok-4、o3、Gemini-2.5 和其他模型相互对抗,玩四子棋。 GPT-5 高压制了所有模型 - 赢得了 14/14 场比赛。随着比赛的进行,模型思考的时间变得更长。查看下面的完整比赛回放。
27.1K