GPT-5 機能に対する私の予測: 最も興味深いものから最も興味深いものへ: - コンテキストの長さが大幅に長い + それを効果的に使用する能力がはるかに優れている (つまり、干し草の山テスト内で針を越えて推論する能力) - はるかにマルチモーダル(モダリティの#と、それぞれのモダリティがどれほど「深い」かの両方の観点から) - マルチモーダル出力、ただし、一部のモダリティは起動時に無効になると思います(安全性など) - GPT-5 と直接話すと、Whisper や音声エンジンを使用せずに GPT-5 が話し返すことを想像してみてください。 - Q*推論の突破口 - 2つのモード:推論+標準 — Q*は推論にかなりの時間/コストを要する可能性があるため、効率のブレークスルーがない限り、今日見られるような標準応答モードも提供する可能性があります - 同様に、GPT-5 には、より高度な形式の適応型コンピューティング/Q* の使用法がある可能性があります...クエリが難しければ難しいほど、優れたソリューションを提供するためにより多くの力が投入されます - エージェント能力が10倍向上...単純な/制約のあるエージェントはほとんど解決され、現実世界のジェネラリストエージェントにはるかに近づきます - 後戻りする能力 — GPT-5 は反省を超えて、答えるときに間違いを認識し、軌道修正することができます - 長期データにわたる非常識なレベルの一貫性...メモリを有効にするために個別のシステムを使用することではなく、プロンプトにすべてのメモリを埋め込むことについて考え始めます...これにより、エージェントも前進します - この最後の 3 つのポイントがあれば、GPT-5 を放っておいて複雑なタスクを任せることができ、動作を確認することなく実際に正しく処理できると信頼できるようになります - OOMでトレーニングされた以前のモデルよりも多くのデータがあり、その多くはChatGPTから収集され、クリーニング、改善され、他のモダリティにキャストされます。 - 現在の主要なモデルよりもはるかに*優れた*データで事後トレーニング - 今日話しているものをはるかに超えた能力が垣間見え始めます - たとえば、科学研究を行うための使用可能な能力に近いものを持つようになります 何を見逃したのでしょうか?どう思いますか。 返信してお知らせください。
116K