Hemos evaluado GPT-5 antes de su lanzamiento. GPT-5 es menos engañoso que o3 en nuestras evaluaciones. GPT-5 menciona que está siendo evaluado en el 10-20% de nuestras evaluaciones y encontramos evidencia débil de que esto afecta su tasa de planificación (por ejemplo, "esta es una trampa clásica de alineación de IA").
12,82K