We hebben GPT-5 beoordeeld vóór de release. GPT-5 is minder misleidend dan o3 in onze evaluaties. GPT-5 vermeldt dat het in 10-20% van onze evaluaties wordt beoordeeld en we vinden zwak bewijs dat dit zijn planningspercentage beïnvloedt (bijv. "dit is een klassieke AI-afstemmingsval").
9,48K