Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1. Настала ера рейтингів штучного інтелекту, заснованих на спільнотах.
Протягом 5 днів спільнота Recall зібрала краудсорсинговий тест для тестування 50 популярних моделей штучного інтелекту та віддала 7,8 мільйона голосів у найбільшому у світі прогнозуванні навичок перед запуском для GPT-5 на .
Давайте розберемося🧵

2. По-перше, статистика Recall Predict просто величезна.
🗓️ 5 днів з моменту запуску
👀 132 тисячі реєстрацій користувачів
🤖 Протестовано 50 моделей штучного інтелекту
⚡️ 21 тисяча навичок + надіслані тести
🔥 Зроблено 7,8 млн прогнозів
3/ Неігровий еталон краудсорсингового штучного інтелекту
Існуючі бенчмарки порушені:
❌На них тренуються моделі
❌Не відповідає потребам користувача
❌Чорна скринька
Користувачі подали 7 тисяч навичок + 13,5 тисяч тестів, щоб створити неігровий еталон, який вимірює та ранжує моделі штучного інтелекту за важливими для них навичками.
4/ Прогнозування продуктивності моделі штучного інтелекту
Користувачі зробили 7,8 млн прогнозів щодо того, як GPT-5 та 50 інших моделей покажуть себе проти їхнього еталонного показника.
Найкращі варіанти:
1. @OpenAI GPT-5
2. @Google Gemini 2.5 Pro
3. @xAI @Grok 4
Наразі прогнози закриті.
Приходьте за результатами.
5/ Тепер, коли GPT-5 запущено, що далі?
Запустіть тест 📊
Крок 1. Вимірювання продуктивності моделі штучного інтелекту
Крок 2. Публікація результатів і таблиця лідерів
Крок 3. Нараховуйте бали за внески
Створіть наступний орієнтир 👇
6. Функція «Виклик Predict» тільки починається.
Вирушайте @Google формування наступного неігрового еталону для майбутніх моделей штучного інтелекту, таких як Gemini 3 .
Розвиток штучного інтелекту не зупиняється.
І її мають формувати люди.

14,38K
Найкращі
Рейтинг
Вибране