Nous avons évalué GPT-5 avant sa sortie. GPT-5 est moins trompeur que o3 dans nos évaluations. GPT-5 mentionne qu'il est évalué dans 10 à 20 % de nos évaluations et nous trouvons des preuves faibles que cela affecte son taux de manigance (par exemple, "c'est un piège classique d'alignement de l'IA").
12,8K