熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Matt Shumer
每個人都忽略了 GPT-5 沒有感覺到巨大飛躍的明顯原因:
AI 的進步不再感覺是指數增長,但它仍然以和以前一樣快的速度在發展。
從 GPT-3 到 GPT-4,我們幾乎沒有看到任何重要的模型發布,因此當 GPT-4 發布時,感覺是革命性的。
但在 GPT-4 之後,我們已經看到了來自 OpenAI、Anthropic、Google、Meta 和其他公司的數十個,甚至可能是數百個漸進式改進。到 GPT-5 到來時,我們已經在小劑量中體驗了它的許多 "魔力"。
然而,如果你直接將 GPT-4 的發布與今天的 GPT-5 進行比較,能力的跳躍與 GPT-3 到 GPT-4 的跳躍一樣戲劇性……我們只是已經習慣了漸進式更新。
事情並沒有放緩。
7.35K
現在 GPT-5 已經推出,你覺得我表現得怎麼樣?
我對這個模型的預測正確嗎?

Matt Shumer2024年4月15日
我對GPT-5能力的預測:
從最不有趣到最有趣:
- 顯著更長的上下文長度 + 更強的有效使用能力(即在稻草堆測試中跨越針的推理能力)
- 更加多模態(無論是在模態數量上還是每個模態的深度)
- 多模態輸出,雖然我猜某些模態在發布時會被禁用(安全等)
- 想像一下直接與GPT-5對話,它會回應,而不使用Whisper或Voice Engine
- Q*推理突破
- 兩種模式:推理 + 正常 — Q*可能需要大量推理時間/成本,因此除非有效率突破,否則他們可能還會提供像今天這樣的正常回應模式
- 同樣,GPT-5可能擁有更先進的自適應計算/Q*使用形式……查詢越困難,它投入的計算能力就越多,以提供出色的解決方案
- 10倍更好的代理能力……簡單/受限的代理將大部分得到解決,我們將更接近現實世界的通用代理
- 回溯能力 — 除了反思,GPT-5將能夠在回答時識別錯誤並修正方向
- 在長期數據中達到瘋狂的連貫性……我們將開始減少使用單獨系統來啟用記憶的思考,而更多地關注將所有記憶嵌入提示中……這也將推動代理的進步
- 有了這最後三點,你將能夠讓GPT-5獨自完成複雜任務,並相信它實際上能正確完成,而無需檢查它的工作
- 在比以前的模型多出OOM的數據上進行訓練,其中大部分來自ChatGPT,經過清理、改進、轉換到其他模態等。
- 在比當前領先模型更*好的*數據上進行後訓練
- 我們將開始看到遠超過今天所談論的能力的曙光——例如,它將擁有更接近可用的科學研究能力
我漏掉了什麼?你怎麼看?
回覆並告訴我。
5.64K
新的 Rork Agent 無疑是世界上最好的移動應用程式建構代理。
如果你想要建立 iOS 或 Android 應用程式,你需要立即試試它。
ASAP.

Rork17 小時前
介紹全新的 Rork Agent 用於行動應用程式
・錯誤自動修正,錯誤減少 90%
・全新的強大代理工具
・運用 Claude Code 的最佳實踐,智慧提升 10 倍
・使用 GPT-5 和 Sonnet 4 產生最佳 UI
最佳的行動應用程式代理來了 👇

7.11K
Rork 剛剛獲得了一次重大升級。GPT-5 使其能力提升了 10 倍。
如果你一直想要開發一個 iPhone 應用,現在就試試吧!!

Rork8月8日 03:42
GPT-5 現在已經在 Rork。
而且它非常棒。
→ 在 Rork 的移動應用基準測試中,比 Claude 4 提升了 190%
→ 在推理/邏輯方面更出色
→ 創造出非常美麗的 UI
現在就來 Rork 試試吧。告訴我們你的想法!
敬請期待。我們還沒有完成。
一個更大的更新即將到來 👀

5.62K
Matt Shumer 已轉發
GPT-5 現已在 Cline 上線。
我們一直在與 OpenAI 合作,準備這個模型,這是我們的看法:它紀律嚴明、堅持不懈且能力出眾。
它在規劃時具有協作性,並在執行時是一個勤奮的操作員。
它徹底規劃,必要時會詢問選項後續問題,然後讓自己退到一旁,發佈代碼。在長任務中,它會持續進行,然後暫停檢查進度。
它遵循指示一絲不苟。最重要的是——它寫出優秀的代碼。
GPT-5 就像《低俗小說》中的「狼」。進來,評估情況,然後執行。
以下是您可以期待在 Cline 中使用 GPT-5 的內容:
> 在規劃時冗長;在執行時簡潔
> 提出很多好的澄清問題,並在適當時經常提供選項
> 在長期範圍內(256k 上下文窗口)具有強大的上下文保留和持續性
> 擅長 diff 風格的編輯和多文件更改(我們會隨著更多使用數據的到來進行監控)
> 在行動模式下安靜——寫代碼而不喋喋不休
元提示是另一個優勢。我們早期與 OpenAI 測試,並使用 GPT-5 調整我們自己的 GPT-5 提示。這是我們喜歡的模式:
“從你自己的角度回答:哪些變更或添加會幫助你更好地遵循這個提示?這是提示(或片段):[snippet]。用戶對 X 和 Y 表示不滿。你會做哪些最小的編輯,同時保持其餘部分不變?”
你需要在 Cline 中更改任何現有模式嗎?不——它開箱即用。給出明確的目標和約束,讓它規劃,然後讓它運行。預期會比大多數模型提出更多澄清問題。
定價:$1.25/M 輸入標記(+90% 緩存),$10/M 輸出。大約是 Sonnet 4 的一半($3/$15)。
想試試 GPT-5 嗎?今天在 Cline 中使用它,通過 OpenAI、Cline 或 OpenRouter 提供者進行純粹、未過濾的推理。
(僅供參考——GPT-5 在提示“建造一些令人印象深刻的東西來展示你的能力”下,單次完成了下面的瀏覽器 DAW)
55.27K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可