Am evaluat GPT-5 înainte de lansare. GPT-5 este mai puțin înșelător decât o3 pe evaluările noastre. GPT-5 menționează că este evaluat în 10-20% din evaluările noastre și găsim dovezi slabe că acest lucru îi afectează rata de intrigi (de exemplu, "aceasta este o capcană clasică de aliniere AI").
12,81K