トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/ コミュニティ主導の AI ランキングの時代が到来しました。
Recall コミュニティは 5 日間にわたって、50 の人気 AI モデルをテストするためのゲーム不可能なベンチマークをクラウドソーシングし、7.8 の GPT-5 に関する世界最大の発売前スキル予測に 5M 票を投じました。
掘り下げ🧵てみましょう

2/ まず、リコール予測の統計は膨大です。
🗓️ 発売から5日
👀 132Kユーザー登録
🤖 50 の AI モデルをテスト
⚡️ 21Kスキル+テスト提出
🔥 7.8M の予測が行われました
3/ クラウドソーシング AI のゲーム不可能なベンチマーク
既存のベンチマークは破られています。
❌モデルはそれらでトレーニングします
❌ユーザーのニーズに合わない
❌ブラックボックス
ユーザーは 7K スキル + 13.5K テストを提出して、自分にとって重要なスキルに基づいて AI モデルを測定およびランク付けする、ゲーム不可能なベンチマークを作成しました。
4/ AIモデルのパフォーマンスの予測
ユーザーは、GPT-5 と他の 50 のモデルがベンチマークに対してどのように機能するかについて 7.8M の予測を行いました。
トップピック:
1. GPT-5 @OpenAI
2. ジェミニ 2.5 プロ@Google
3. @xAI @Grok 4
予測は終了しました。
結果については訪問してください。
5/ GPT-5 がリリースされた今、次は何でしょうか?
ベンチマーク📊を実行する
ステップ 1.AI モデルのパフォーマンスを測定する
ステップ 2.結果とリーダーボードを公開する
ステップ 3.貢献に対する評価ポイント
次のベンチマーク👇を構築する
6/ リコール予測はまだ始まったばかりです。
Gemini 3 のような今後の AI モデルについて、コミュニティ主導の次のベンチマークを形作る@Googleに向かいましょう。
AI開発は止まりません。
そして、それは人々によって形作られるべきです。

21.16K
トップ
ランキング
お気に入り