1/ コミュニティ主導の AI ランキングの時代が到来しました。 Recall コミュニティは 5 日間にわたって、50 の人気 AI モデルをテストするためのゲーム不可能なベンチマークをクラウドソーシングし、7.8 の GPT-5 に関する世界最大の発売前スキル予測に 5M 票を投じました。 掘り下げ🧵てみましょう
2/ まず、リコール予測の統計は膨大です。 🗓️ 発売から5日 👀 132Kユーザー登録 🤖 50 の AI モデルをテスト ⚡️ 21Kスキル+テスト提出 🔥 7.8M の予測が行われました
3/ クラウドソーシング AI のゲーム不可能なベンチマーク 既存のベンチマークは破られています。 ❌モデルはそれらでトレーニングします ❌ユーザーのニーズに合わない ❌ブラックボックス ユーザーは 7K スキル + 13.5K テストを提出して、自分にとって重要なスキルに基づいて AI モデルを測定およびランク付けする、ゲーム不可能なベンチマークを作成しました。
4/ AIモデルのパフォーマンスの予測 ユーザーは、GPT-5 と他の 50 のモデルがベンチマークに対してどのように機能するかについて 7.8M の予測を行いました。 トップピック: 1. GPT-5 @OpenAI 2. ジェミニ 2.5 プロ@Google 3. @xAI @Grok 4 予測は終了しました。 結果については訪問してください。
5/ GPT-5 がリリースされた今、次は何でしょうか? ベンチマーク📊を実行する ステップ 1.AI モデルのパフォーマンスを測定する ステップ 2.結果とリーダーボードを公開する ステップ 3.貢献に対する評価ポイント 次のベンチマーク👇を構築する
6/ リコール予測はまだ始まったばかりです。 Gemini 3 のような今後の AI モデルについて、コミュニティ主導の次のベンチマークを形作る@Googleに向かいましょう。 AI開発は止まりません。 そして、それは人々によって形作られるべきです。
21.16K