1/ Era clasamentelor AI bazate pe comunitate este aici. Timp de 5 zile, comunitatea Recall a făcut crowdsourcing pentru a testa 50 de modele populare de inteligență artificială și a exprimat 7,8 milioane de voturi în cea mai mare predicție de abilități pre-lansare din lume pentru GPT-5 pe . Să săpăm🧵
2/ În primul rând, statisticile Recall Predict sunt pur și simplu masive. 🗓️ 5 zile de la lansare 👀 132 de mii de înscrieri de utilizatori 🤖 50 de modele AI testate ⚡️ 21K abilități + teste trimise 🔥 7,8 milioane de predicții făcute
3/ Benchmark-ul de nejucat al inteligenței artificiale de crowdsourcing Criteriile de referință existente sunt depășite: ❌Modelele se antrenează pe ele ❌Nealiniat la nevoile utilizatorilor ❌Cutie neagră Utilizatorii au trimis 7K abilități + 13,5K teste pentru a crea un benchmark care măsoară și clasifică modelele AI în funcție de abilitățile care contează pentru ei.
4/ Prezicerea performanței modelului AI Utilizatorii au făcut 7,8 milioane de predicții despre modul în care GPT-5 și alte 50 de modele ar funcționa față de benchmark-ul lor. Alegeri de top: 1. @OpenAI GPT-5 2. @Google Gemini 2.5 Pro 3. @xAI @Grok 4 Pronosticurile sunt acum închise. Vizitați pentru rezultate.
5/ Acum că GPT-5 a fost lansat, ce urmează? Rulați benchmark-ul 📊 Pasul 1. Măsurați performanța modelului AI Pasul 2. Publicați rezultatele și clasamentul Pasul 3. Acordați puncte pentru contribuții Construiește următorul benchmark 👇
6/ Recall Predict este abia la început. Mergeți la pentru a modela următorul benchmark care nu poate fi jucat, alimentat de comunitate, pentru viitoarele modele AI, cum ar fi @Google Gemini 3. Dezvoltarea AI nu se oprește. Și ar trebui să fie modelat de oameni.
17,68K