Тепер, коли GPT-5 вийшов, як ви думаєте, я це зробив? Чи були мої прогнози щодо моделі правильними?
Matt Shumer
Matt Shumer15 квіт. 2024 р.
Мої прогнози щодо можливостей GPT-5: Від найменш до найцікавішого: - значно більша довжина контексту + набагато більша здатність ефективно його використовувати (тобто здатність міркувати через голки в тестах на копиці сіна) - набагато більш мультимодальні (як з точки зору # модальностей, так і з точки зору того, наскільки «глибоко» заходить кожна з них) - мультимодальні виходи, хоча я припускаю, що деякі модальності будуть відключені при запуску (безпека і т.д. і т.д.) - уявіть, що ви розмовляєте безпосередньо з GPT-5, і він розмовляє у відповідь, без використання Whisper або Voice Engine - Q* Прорив в міркуваннях - Два режими: міркування + нормальний — Q* може зайняти значний час/витрати на висновок, тому, якщо немає прориву в ефективності, вони також можуть запропонувати режим нормальної відповіді, як ми бачимо сьогодні - Аналогічно, GPT-5 може мати більш просунуту форму адаптивного використання обчислень/Q*... Чим складніший запит, тим більше потужності він вкладає в нього, щоб надати чудове рішення - У 10 разів кращі агентські можливості... Прості/обмежені агенти в основному будуть вирішені, і ми станемо набагато ближчими до реальних, універсальних агентів - здатність повертатися назад — поза роздумами, GPT-5 зможе розпізнавати помилки під час відповідей і коригувати курс - шалений рівень узгодженості в довгострокових даних... Ми почнемо менше думати про використання окремих систем для включення пам'яті, а більше про просте вбудовування всіх спогадів у командний рядок... Це також підштовхне агентів вперед - з цими останніми трьома пунктами ви зможете залишити GPT-5 у спокої та дозволити йому виконувати складні для вас завдання, а також повірити в те, що він дійсно виконає їх правильно без необхідності перевіряти його роботу - навчено на OOM більше даних, ніж попередні моделі, значна частина яких збирається з ChatGPT, очищається, допрацьовується, переводиться на інші модальності тощо. - Після навчання на набагато *кращих* даних, ніж поточні провідні моделі - Ми почнемо бачити проблиски можливостей, що виходять далеко за рамки того, про що ми говоримо сьогодні — наприклад, він буде ближчим до використання здібностей для проведення наукових досліджень Чого мені не вистачало? Як ти гадаєш? Дайте відповідь і дайте мені знати.
5,99K