這一直是有關大型語言模型中期發展軌跡的最具資訊性的基準:領域專家在嘗試將這些模型應用於相對複雜的問題時的經驗是什麼?如果你一直在關注這個問題,GPT-5 的任何事情都不應該讓你感到驚訝。
727