Ми оцінили GPT-5 перед релізом. GPT-5 менш оманливий, ніж o3 на наших евалах. GPT-5 згадує, що його оцінюють у 10-20% наших евалів, і ми знаходимо слабкі докази того, що це впливає на швидкість його інтриг (наприклад, «це класична пастка вирівнювання ШІ»).
9,48K