熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
從嘗試 gpt-5 幾個小時以來,我可以說:
我無法告訴它和 o3 之間有什麼太大的區別。
就我所知,它是一個始終如一的推理者。
感覺像是一個稍微大一點的模型,但在不需要推理的任務上,表現不如 4.5。
似乎仍然嘗試給出短於 8k 的回應。
仍然保持著相同的 gpt 個性,我已經放棄了認為它會突破這一點的想法。
閱讀它所寫故事的人對此評價不一。
可能會在基準測試中表現出色,但我無法察覺任何差異。
至少沒有 gpt-oss 那種「無知無靈魂」的感覺,但比 4.5 還要少。
感覺像是 4o 的完整版本?帶有一點 4.5 的感覺,但還不完全。
我不知道,對我來說,這感覺不像是 3.5 到 4 之間的差異,但也許我會在直播中被我尚未探索的某些東西驚訝到。
它最喜歡的動漫顯然是《鋼之鍊金術師》,順便說一下,這不是個壞選擇。
我無法測試的事項:
編碼
多模態
工具使用/代理
89.91K
熱門
排行
收藏