現在 GPT-5 已經推出,你覺得我表現得怎麼樣? 我對這個模型的預測正確嗎?
Matt Shumer
Matt Shumer2024年4月15日
我對GPT-5能力的預測: 從最不有趣到最有趣: - 顯著更長的上下文長度 + 更強的有效使用能力(即在稻草堆測試中跨越針的推理能力) - 更加多模態(無論是在模態數量上還是每個模態的深度) - 多模態輸出,雖然我猜某些模態在發布時會被禁用(安全等) - 想像一下直接與GPT-5對話,它會回應,而不使用Whisper或Voice Engine - Q*推理突破 - 兩種模式:推理 + 正常 — Q*可能需要大量推理時間/成本,因此除非有效率突破,否則他們可能還會提供像今天這樣的正常回應模式 - 同樣,GPT-5可能擁有更先進的自適應計算/Q*使用形式……查詢越困難,它投入的計算能力就越多,以提供出色的解決方案 - 10倍更好的代理能力……簡單/受限的代理將大部分得到解決,我們將更接近現實世界的通用代理 - 回溯能力 — 除了反思,GPT-5將能夠在回答時識別錯誤並修正方向 - 在長期數據中達到瘋狂的連貫性……我們將開始減少使用單獨系統來啟用記憶的思考,而更多地關注將所有記憶嵌入提示中……這也將推動代理的進步 - 有了這最後三點,你將能夠讓GPT-5獨自完成複雜任務,並相信它實際上能正確完成,而無需檢查它的工作 - 在比以前的模型多出OOM的數據上進行訓練,其中大部分來自ChatGPT,經過清理、改進、轉換到其他模態等。 - 在比當前領先模型更*好的*數據上進行後訓練 - 我們將開始看到遠超過今天所談論的能力的曙光——例如,它將擁有更接近可用的科學研究能力 我漏掉了什麼?你怎麼看? 回覆並告訴我。
6.43K