1. Настала ера рейтингів штучного інтелекту, заснованих на спільнотах. Протягом 5 днів спільнота Recall зібрала краудсорсинговий тест для тестування 50 популярних моделей штучного інтелекту та віддала 7,8 мільйона голосів у найбільшому у світі прогнозуванні навичок перед запуском для GPT-5 на . Давайте розберемося🧵
2. По-перше, статистика Recall Predict просто величезна. 🗓️ 5 днів з моменту запуску 👀 132 тисячі реєстрацій користувачів 🤖 Протестовано 50 моделей штучного інтелекту ⚡️ 21 тисяча навичок + надіслані тести 🔥 Зроблено 7,8 млн прогнозів
3/ Неігровий еталон краудсорсингового штучного інтелекту Існуючі бенчмарки порушені: ❌На них тренуються моделі ❌Не відповідає потребам користувача ❌Чорна скринька Користувачі подали 7 тисяч навичок + 13,5 тисяч тестів, щоб створити неігровий еталон, який вимірює та ранжує моделі штучного інтелекту за важливими для них навичками.
4/ Прогнозування продуктивності моделі штучного інтелекту Користувачі зробили 7,8 млн прогнозів щодо того, як GPT-5 та 50 інших моделей покажуть себе проти їхнього еталонного показника. Найкращі варіанти: 1. @OpenAI GPT-5 2. @Google Gemini 2.5 Pro 3. @xAI @Grok 4 Наразі прогнози закриті. Приходьте за результатами.
5/ Тепер, коли GPT-5 запущено, що далі? Запустіть тест 📊 Крок 1. Вимірювання продуктивності моделі штучного інтелекту Крок 2. Публікація результатів і таблиця лідерів Крок 3. Нараховуйте бали за внески Створіть наступний орієнтир 👇
6. Функція «Виклик Predict» тільки починається. Вирушайте @Google формування наступного неігрового еталону для майбутніх моделей штучного інтелекту, таких як Gemini 3 . Розвиток штучного інтелекту не зупиняється. І її мають формувати люди.
14,38K