Sekarang GPT-5 keluar, menurut Anda bagaimana saya melakukannya? Apakah prediksi saya untuk model itu benar?
Matt Shumer
Matt Shumer15 Apr 2024
Prediksi saya untuk kemampuan GPT-5: Dari yang paling sedikit hingga yang paling menarik: - panjang konteks yang jauh lebih panjang + kemampuan yang jauh lebih besar untuk menggunakannya secara efektif (yaitu kemampuan untuk bernalar melintasi jarum dalam tes tumpukan jerami) - jauh lebih multimodal (baik dalam hal # modalitas dan seberapa 'dalam' masing-masing pergi) - output multimodal, meskipun saya kira beberapa modalitas akan dinonaktifkan saat peluncuran (keamanan dll. dll.) - bayangkan berbicara langsung ke GPT-5, dan ia membalasnya, tanpa menggunakan Whisper atau Voice Engine - Terobosan penalaran Q* - Dua mode: penalaran + normal — Q* mungkin membutuhkan waktu/biaya inferensi yang signifikan sehingga kecuali ada terobosan efisiensi, mereka juga dapat menawarkan mode respons normal seperti yang kita lihat hari ini - Demikian pula, GPT-5 mungkin memiliki bentuk penggunaan komputasi adaptif/Q* yang lebih canggih... Semakin sulit kueri, semakin banyak kekuatan yang diberikannya untuk memberikan solusi yang bagus - Kemampuan agen 10x lebih baik... Agen sederhana/terbatas sebagian besar akan diselesaikan, dan kita akan lebih dekat dengan agen generalis dunia nyata - kemampuan untuk mundur — di luar refleksi, GPT-5 akan dapat mengenali kesalahan saat menjawab, dan memperbaiki arah - tingkat koherensi yang gila di seluruh data jangka panjang... Kita akan mulai berpikir lebih sedikit tentang menggunakan sistem terpisah untuk mengaktifkan memori dan lebih banyak tentang hanya menyematkan semua memori dalam prompt... Ini juga akan mendorong agen maju - dengan tiga poin terakhir ini, Anda akan dapat meninggalkan GPT-5 dan membiarkannya menjadi tugas yang rumit untuk Anda, dan percaya bahwa GPT-5 benar-benar melakukannya dengan benar tanpa perlu memeriksa pekerjaannya - dilatih pada OOM lebih banyak data daripada model sebelumnya, yang sebagian besar dikumpulkan dari ChatGPT, dibersihkan, ditingkatkan, ditransmisikan ke modalitas lain, dll. - pasca-pelatihan pada data yang jauh *lebih baik* daripada model terkemuka saat ini - Kita akan mulai melihat sekilas kemampuan yang jauh melampaui apa yang kita bicarakan hari ini — misalnya, itu akan memiliki kemampuan yang lebih dekat dengan yang dapat digunakan untuk melakukan penelitian ilmiah Apa yang saya lewatkan? Bagaimana menurutmu? Balas dan beri tahu saya.
5,64K