好的,收集一下我对GPT-5的整体印象: - 最大的升级似乎是从4o到5。我很少使用这些模型,但对于普通用户来说,这是一次巨大的升级。 - 5-T有时比o3更好,有时更差。我发现我经常在这里进行并排查询,这很烦人。o3有时似乎搜索得更深入、更彻底。o3也更“奇怪”/更像一个自闭症患者,这我个人是喜欢的。 - 5-pro真的非常聪明,显然是“市场上最聪明的模型”,适合复杂问题。我需要花更多时间在这里测试,但到目前为止,它产生的结果比o3 pro更好。 - 昨晚我在Cursor/GPT5上花了几个小时,印象非常深刻。这个模型真的很快,指令跟随和工具调用明显更好,整体上更可靠。你仍然需要使用所有常规的AI编码保护措施来获得良好的结果,但在能力方面,它感觉大致和Claude Code / Sonnet一样好,而且据我目前所知,它在处理更复杂的UI/前端方面实际上更好。 - 目前CC仍然感觉比Codex更好,但我相信他们会赶上。 - 他们似乎增强了GPT5-T的小说写作能力。我第一次得到了些有趣/新颖的东西,这是新的。(将在回复推文中发布一个例子)。 - 我发现进入GPT5-T / Pro的用户体验很烦人(一个子菜单?真的?)希望这只是一个简单的修复。 总体来说: - 作为Pro用户我非常满意,但我能理解为什么Plus用户可能会抱怨模型路由。ChatGPT仍然是我大多数AI使用的主要选择。 - 我完全看不到“平台期”,我认为人们反应过快。还有很多时间可以在工具调用/代理前沿扩展。(也许在编码时最容易看到这一点,因为那是最大的改进似乎发生的地方。) - 我预计OpenAI会从这次发布中获得很好的收益,他们的数字将继续上升。正如他们应该的那样。
我提到的 o3/5-T 搜索示例:
Nabeel S. Qureshi
Nabeel S. Qureshi8月8日 22:05
仍在摸索中,但新的 GPT5-T 在搜索方面似乎比 o3 差。这是一个并排的例子,我让它找到一本在 2024 年 11 月出版的书。o3 找到了,并给出了详细的摘要;而 GPT5-T 根本没有找到。
关于创意写作,我请它写一段关于在乔伊斯的《芬尼根的觉醒》风格中喝冷萃咖啡的文字,下面的模仿让我印象深刻。对于一个经过后期训练的模型来说,创意和新颖性比平常要多得多(例如,把咖啡称为“税煤黑”很有趣)。
(此外,所有这些都是在玩这个模型不到半天的时间里得出的,所以随着我对模型的了解加深,预计这些看法会有所变化……)
@ChrisSpoke 最好,和大多数事情一样,可能就是试一个月,看看效果如何。
4.06K