这一直是关于大型语言模型(LLMs)中期发展轨迹最具信息量的基准:领域专家在尝试将这些模型应用于相对复杂的问题时的经验是什么?如果你一直在关注这个问题,GPT-5 的任何内容都不应该让你感到惊讶。
689