حسنا ، جمع مرات ظهور GPT-5 الإجمالية: - يبدو أن أكبر ترقية هي 4o -> 5. نادرا ما أستخدم هذه النماذج ولكن بالنسبة للمستخدم المتوسط ، فهذه ترقية ضخمة. - 5-T في بعض الأحيان أفضل من o3 ، وأحيانا أسوأ. العثور على أنني غالبا ما أقوم باستفسارات جنبا إلى جنب هنا ، وهو أمر مزعج. يبدو أن O3 يبحث بشكل أعمق وأكثر شمولا في بعض الأحيان. o3 هو أيضا _غرابة_ / أكثر من مصاب بالتوحد الذي أحبه شخصيا. - 5-Pro ذكي حقا ، ومن الواضح أنه "أذكى نموذج في السوق" للأسئلة المعقدة. أحتاج إلى قضاء المزيد من الوقت في الاختبار هنا ، لكنها حققت حتى الآن نتائج أفضل من o3 pro. - قضيت بضع ساعات في Cursor / GPT5 الليلة الماضية وقد تأثرت للغاية. النموذج يطير حقا ، والتعليمات التالية + استدعاء الأداة أفضل بشكل ملحوظ ، وهي أكثر موثوقية بشكل عام. ما زلت بحاجة إلى استخدام جميع حواجز حماية ترميز الذكاء الاصطناعي المعتادة للحصول على نتيجة جيدة ، لكنها تبدو جيدة تقريبا مثل Claude Code / Sonnet الآن من حيث القدرة ، وهي في الواقع أفضل في القيام بواجهات مستخدم / واجهة أمامية أكثر تعقيدا مما يمكنني قوله حتى الآن. - لا يزال CC يبدو وكأنه منتج شامل أفضل من Codex بالنسبة لي في الوقت الحالي ، لكنني متأكد من أنهم سيلحقون بالركب. - يبدو أنهم عززوا قدرات الكتابة الخيالية ل GPT5-T. لقد حصلت على بعض الأشياء الشيقة / الجديدة منه لأول مرة ، وهو جديد. (سيتم نشر مثال في تغريدات الرد). - أجد تجربة المستخدم للوصول إلى GPT5-T / Pro مزعجا (قائمة فرعية؟ حقا؟) وأتمنى أن تكون مجرد تبديل. نأمل أن يكون هذا حلا سهلا. العام: - سعيد جدا كمستخدم Pro ، لكن يمكنني أن أرى لماذا قد يشتكي مستخدمو Plus من جهاز التوجيه النموذجي. لا يزال ChatGPT هو المذهب الرئيسي لمعظم استخدامات الذكاء الاصطناعي. - لا أرى نقطة "الهضبة" على الإطلاق وأعتقد أن الناس يبالغون في رد فعلهم بسرعة كبيرة. متسع من الوقت للتوسع على طول حدود استدعاء الأدوات / الوكيل ، لسبب واحد. (ربما يكون من الأسهل رؤية هذا عند الترميز ، لأن هذا هو المكان الذي يبدو أن فيه أكبر تحسن قد أتى.) - أتوقع أن تعمل OpenAI بشكل جيد للغاية من هذا الإصدار وستستمر أعدادها في الارتفاع. كما ينبغي.
مثال البحث o3 / 5-T الذي ذكرته:
Nabeel S. Qureshi
Nabeel S. Qureshi‏8 أغسطس، 22:05
ما زلت أشعر بذلك ، لكن GPT5-T الجديد يبدو أسوأ في البحث من o3. إليك مثال جنبا إلى جنب حيث أطلب منه العثور على كتاب نشر في نوفمبر 2024. O3 يجدها ويعطي ملخصا مفصلا. GPT5-T لا يجده على الإطلاق.
فيما يتعلق بالكتابة الإبداعية ، طلبت منه إجراء فقرة حول الحصول على مشروب بارد بأسلوب جويس Finnegans Wake وأعجبت بالباستيش أدناه. بالنسبة لنموذج ما بعد التدريب ، هناك الكثير من الحداثة / الإبداع أكثر من المعتاد (على سبيل المثال ، كان "أسود الفحم المتحرك" للقهوة مضحكا).
(أيضا ، كل هذا من اللعب مع النموذج لمدة تقل عن نصف يوم ، لذا توقع أن تتغير بعض هذه اللقطات عندما أتعرف على النماذج بشكل أفضل ...)
@ChrisSpoke الأفضل ، كما هو الحال مع معظم الأشياء ، ربما يكون مجرد المحاولة لمدة شهر ومعرفة كيف ستسير الأمور
‏‎4.06‏K