從嘗試 gpt-5 幾個小時以來,我可以說: 我無法告訴它和 o3 之間有什麼太大的區別。 就我所知,它是一個始終如一的推理者。 感覺像是一個稍微大一點的模型,但在不需要推理的任務上,表現不如 4.5。 似乎仍然嘗試給出短於 8k 的回應。 仍然保持著相同的 gpt 個性,我已經放棄了認為它會突破這一點的想法。 閱讀它所寫故事的人對此評價不一。 可能會在基準測試中表現出色,但我無法察覺任何差異。 至少沒有 gpt-oss 那種「無知無靈魂」的感覺,但比 4.5 還要少。 感覺像是 4o 的完整版本?帶有一點 4.5 的感覺,但還不完全。 我不知道,對我來說,這感覺不像是 3.5 到 4 之間的差異,但也許我會在直播中被我尚未探索的某些東西驚訝到。
它最喜歡的動漫顯然是《鋼之鍊金術師》,順便說一下,這不是個壞選擇。
我無法測試的事項: 編碼 多模態 工具使用/代理
89.91K