GPT-5 supera o Claude Opus 4.1 em programação e torna-se o melhor modelo de programação do mundo! Ele alcança 74,9% no SWE-Bench, superando os 74,5% do Claude Opus 4.1. Isto terá grandes implicações para a avaliação da Anthropic...
é engraçado que eles pensem: - 52.8 > 69.1 - 69.1 = 30.8
130,77K