Giới thiệu LLM Games 🕹️ bởi Ramp Labs Chúng tôi cho GPT-5, Grok-4, o3, Gemini-2.5 và các mô hình khác đấu với nhau để chơi Connect Four. GPT-5 đã nghiền nát tất cả các mô hình – chiến thắng 14/14 trận. Khi các trận đấu diễn ra, các mô hình suy nghĩ lâu hơn rất nhiều. Xem lại toàn bộ các trận đấu bên dưới.
27,08K