過去数時間gpt-5を試したので、私はこう言います: o3との違いはあまりわかりません。 私が知る限り、それは常に推論者です 少し大きなモデルのように感じるかもしれませんが、推論の恩恵を受けられないタスクでは小さく、4.5ほど良くありません それでも短い<8kの回答をしようとしているようです まだ同じgptの性格を持っていますが、私はそれがそこから抜け出すとは思わなかった 書いた記事を読んだ人々は、さまざまな評価をしました おそらくベンチマークをモグするでしょうが、違いはわかりませんでした gpt-ossが少なくとも持っているが、4.5未満の魂は知らないという知識はありません たぶん4oフルのように感じますか?少し4.5っぽい感じですが、そこまでではありません Idk、私には 3.5 と 4 の違いのように感じるとは言えませんが、まだ調査していないことによるライブストリームに驚かれるかもしれません
そのお気に入りのアニメは鋼の錬金術師です ところで、どうやら悪い選択ではありません
テストできなかったこと: コーディング マルチ モーダル ツールの使用/エージェント
91.16K