この長い投稿を読むのに 2 分の時間があれば、Chat-GPT5 に関する私の正直なフィードバックが届くでしょう。 私はChat-GPT5を試すことに興奮しており、今日はGoogle Gemini 2.5 ProとClaude 4と一緒に4+時間ライブテストしました。 そして最終判決は... 結果には非常にがっかりしています。Google Geminiはほとんどのプロンプトで最高のパフォーマンスを発揮し、Claude 4は通常2位でした(以下のシートを確認してください:3は良い、1は悪いです) ChatGPT が本当に優れていたタスクの 1 つは、マウスの移動やクリックなどの入力に応答するブラウザベースの音楽ジェネレーターを作成することでした (非常に優れた録音機能を使用しても)、それ以外は期待した結果が得られず、2-3 回のプロンプトの後でも実用的な例を生成できないことがよくありました。 完全なコンテキストを提供するために、公式 Web サイトで Chat-GPT をテストし、次に Cursor を使用してテストしました。Cursor を使用すると、はるかにうまく機能しましたが、それでも他のモデルに大きく遅れをとっています。私が最も嫌いだったのは、最初のプロンプトから立ち往生し、何も機能しないことですが、他の 2 つのモデルには、ほとんどの場合、少なくとも確認してテストできる何らかのタイプの出力がありました。 今日、Google Gemini ではマルチプレイヤー アプリケーションを作成できることもわかりました。はい、正しく聞こえました:たとえば、マルチプレイヤーゲームの場合、状態と変換を同期します(Firebaseを使用していますが、それでも実用的なプロトタイプを取得するのは印象的です!無料で。もちろん完璧ではありませんが、これにより、特に小規模なマルチプレイヤー ゲームのプロトタイピングに非常に多くの可能性が開かれます。 とはいえ、GPT-5 は強力なモデルであり、非常に高速だと思いますが、他の 2 つの最近のモデルを完全に上回ると予想していましたが、少なくとも私がテストしたベンチマークに基づくと、そうではありませんでした (本番稼働前に試したわけではなく、これはリアルタイム テストでした)。 これは「使用しないと取り残されるべき新しいモデル」だと考える人と喜んで話し合いたいのですが、それはこの特定の一連のテスト (4 時間以上続いた) での私の経験ではなかったからです。 士気: ソーシャル メディアで見るものをすべて信頼しないでください、またはさらに良いことに、誰も信用しないでください。 自分でテストをして、自分の頭で考えてください。
@patloeberタイプミスが興奮しすぎてすみません
3.37K