1/ Era peringkat AI yang didukung komunitas telah tiba. Selama 5 hari, komunitas Recall mengumpulkan tolok ukur yang tidak dapat dimainkan untuk menguji 50 model AI populer dan memberikan 7,8 juta suara dalam prediksi keterampilan pra-peluncuran terbesar di dunia untuk GPT-5 pada . Mari kita gali🧵
2/ Pertama, statistik Recall Predict sangat besar. 🗓️ 5 hari sejak peluncuran 👀 132 ribu pendaftaran pengguna 🤖 50 model AI diuji ⚡️ 21K keterampilan + tes yang diajukan 🔥 7,8 juta prediksi dibuat
3/ Crowdsourcing: tolok ukur AI yang tidak dapat dimainkan Tolok ukur yang ada dilanggar: ❌Model berlatih di atasnya ❌Tidak selaras dengan kebutuhan pengguna ❌Kotak hitam Pengguna mengirimkan tes keterampilan 7K + 13,5K untuk membuat tolok ukur yang tidak dapat dimainkan yang mengukur dan memberi peringkat model AI berdasarkan keterampilan yang penting bagi mereka.
4/ Mprediksi kinerja model AI Pengguna membuat prediksi 7,8 juta tentang bagaimana GPT-5 dan 50 model lainnya akan berkinerja terhadap tolok ukur mereka. Pilihan teratas: 1. @OpenAI GPT-5 2. @Google Gemini 2.5 Pro 3. @xAI @Grok 4 Prediksi sekarang ditutup. Kunjungi untuk hasil.
5/ Sekarang GPT-5 telah diluncurkan, apa selanjutnya? Jalankan tolok ukur 📊 Langkah 1. Mengukur performa model AI Langkah 2. Publikasikan hasil dan papan peringkat Langkah 3. Berikan poin untuk kontribusi Buat benchmark 👇 berikutnya
6/ Recall Predict baru saja dimulai. Menuju untuk membentuk tolok ukur yang tidak dapat dimainkan dan didukung komunitas berikutnya untuk model AI yang akan datang seperti @Google Gemini 3. Pengembangan AI tidak berhenti. Dan itu harus dibentuk oleh orang-orang.
17,69K