Представляємо ігри 🕹️ LLM від Ramp Labs Ми протиставляємо GPT-5, Grok-4, o3, Gemini-2.5 та інші моделі, щоб грати в Connect Four. Високий GPT-5 розгромив усі моделі, вигравши 14/14 ігор. У міру того, як ігри прогресують, моделі думають набагато довше. Дивіться повні повтори ігор нижче.
27,08K