现在GPT-5已经发布,你觉得我做得怎么样? 我对这个模型的预测正确吗?
Matt Shumer
Matt Shumer2024年4月15日
我对GPT-5能力的预测: 从最不有趣到最有趣: - 显著更长的上下文长度 + 更强的有效使用能力(即在干草堆测试中跨针推理的能力) - 更加多模态(无论是模态数量还是每个模态的深度) - 多模态输出,尽管我猜测某些模态在发布时会被禁用(安全等) - 想象一下直接与GPT-5对话,它会回应,而不使用Whisper或Voice Engine - Q*推理突破 - 两种模式:推理 + 正常 — Q*可能需要显著的推理时间/成本,因此除非有效率突破,否则它们可能还会提供像我们今天看到的那样的正常响应模式 - 同样,GPT-5可能具有更高级的自适应计算/Q*使用形式……查询越难,它投入的计算能力就越多,以提供出色的解决方案 - 10倍更好的代理能力……简单/受限的代理将大部分得到解决,我们将更接近现实世界的通用代理 - 回溯能力——超越反思,GPT-5将能够在回答时识别错误并纠正方向 - 在长期数据中具有惊人的连贯性……我们将开始减少使用独立系统来启用记忆的想法,而更多地考虑将所有记忆嵌入提示中……这也将推动代理的发展 - 通过这最后三点,你将能够让GPT-5独立完成复杂任务,并相信它确实能正确完成,而无需检查它的工作 - 在比之前的模型多出OOM的数据上进行训练,其中大部分数据来自ChatGPT,经过清理、改进、转换为其他模态等。 - 在比当前领先模型更*好的*数据上进行后训练 - 我们将开始看到远超我们今天讨论的能力的曙光——例如,它将拥有更接近可用的科学研究能力 我遗漏了什么?你怎么看? 回复让我知道。
6.43K