المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Taelin
نوع / ثني / HVM / INets / λ حساب التفاضل والتكامل
تعاني من إجهاد chatbot؟
هل تشعر بالإحباط من إلغاء التفرد؟
هل تبحث عن شيء جديد يمنحك الأمل؟
ها هي خطتي الوهمية ، لكن "مهلا ، من المنطقي نوعا ما" لبناء ذكاء فائق في مختبر الأبحاث المستقل الصغير الخاص بي
(ملاحظة: سأتداول الدقة في علم أصول التدريس)
أولا ، خلفية:
أنا رجل يبلغ من العمر 33 عاما أمضيت آخر 22 عاما في البرمجة. خلال الوقت ، طرحت العديد من الأسئلة حول طبيعة الحوسبة ، وتراكمت بعض ... غريب... البصائر. قبل بضع سنوات ، قمت ببناء HVM ، وهو نظام قادر على تشغيل البرامج بلغة مقصورة على فئة معينة تسمى "Haskell" على وحدة معالجة الرسومات - نعم ، نفس الشريحة التي جعلت التعلم العميق يعمل ، وأثارت دورة الذكاء الاصطناعي بأكملها.
ولكن كيف يرتبط هاسكل الذكاء الاصطناعي؟
حسنا ، هذه قصة طويلة. كما قد يتذكر الشيوخ ، في ذلك الوقت ، كان ما أطلقنا عليه اسم "الذكاء الاصطناعي" ... مختلف. منذ ما يقرب من 3 عقود ، ولأول مرة على الإطلاق ، هزم جهاز كمبيوتر بطل العالم في لعبة الشطرنج ، مما أثار العديد من المناقشات حول الذكاء الاصطناعي العام والتفرد - تماما كما هو الحال اليوم!
كان النظام ، المسمى Deep Blue ، مختلفا تماما عن النماذج التي لدينا اليوم. لم تستخدم المحولات. لم تستخدم الشبكات العصبية على الإطلاق. في الواقع ، لم يكن هناك "نموذج". لقد كان "الذكاء الاصطناعي الرمزي" الخالص ، مما يعني أنه كان مجرد خوارزمية قديمة بسيطة ، قامت بمسح مليارات الحركات الممكنة ، أسرع وأعمق مما يمكن لأي إنسان ، وتغلب علينا بالقوة الغاشمة المطلقة.
أثار هذا موجة من أبحاث الذكاء الاصطناعي الرمزية الواعدة. الخوارزميات التطورية ، والرسوم البيانية المعرفية ، وإثبات النظرية الآلي ، ومحللات SAT / SMT ، وحل القيود ، والأنظمة الخبيرة ، وغير ذلك الكثير. للأسف ، بمرور الوقت ، اصطدم النهج بالحائط. لم تتوسع القواعد المصنوعة يدويا ، ولم تكن الأنظمة الرمزية قادرة على * التعلم * ديناميكيا ، وانفجرت الفقاعة. بدأ شتاء الذكاء الاصطناعي الجديد.
بعد سنوات فقط ، غيرت المحاذاة الغريبة للعوامل كل شيء. قام الباحثون بإزالة الغبار عن فكرة قديمة - الشبكات العصبية - ولكن هذه المرة ، كان لديهم شيء جديد: وحدات معالجة الرسومات. تبين أن رقائق الرسومات هذه ، التي تم تصميمها في الأصل لتقديم ألعاب الفيديو ، مثالية لمضاعفة المصفوفة الهائلة التي تتطلبها الشبكات العصبية. فجأة ، ما استغرق أسابيع يمكن القيام به في ساعات. انفجر التعلم العميق ، وها نحن اليوم ، مع المحولات التي تأكل العالم.
ولكن هذا هو الشيء: لقد قمنا فقط بنقل * فرع واحد * من الذكاء الاصطناعي إلى وحدات معالجة الرسومات - التوصيل العددي. الجانب الرمزي؟ لا يزال عالقا في العصر الحجري لوحدة المعالجة المركزية.
Haskell هي لغة خاصة ، لأنها توحد لغة البراهين (أي المصطلح الذي يستخدمه علماء الرياضيات للتعبير عن النظريات) مع لغة البرمجة (أي ما يستخدمه المطورون لإنشاء التطبيقات). هذا يجعلها مناسبة بشكل فريد للتفكير الرمزي - النوع الدقيق من الحساب الذي استخدمه Deep Blue ، ولكن يمكننا الآن تشغيله بشكل متوازي على نطاق واسع على الأجهزة الحديثة.
(لكي نكون أكثر دقة ، فإن التوازي الهائل لوحدة معالجة الرسومات ليس هو الشيء الوحيد الذي يجلبه HVM إلى الطاولة. اتضح أنه يؤدي أيضا إلى تسريع * مقارب * في بعض الحالات. وهذا سبب رئيسي للإيمان بنهجنا: لم تكن الأساليب الرمزية السابقة مجرد تجويع حسابيا. كانت بطيئة بشكل كبير ، بالمعنى الخوارزمي. لا عجب أنها لم تنجح. لم يكن لديهم فرصة لذلك.)
أطروحتي بسيطة: الآن بعد أن تمكنت من تشغيل Haskell على وحدات معالجة الرسومات ، وبالنظر إلى هذا التسريع المقارب ، فأنا في وضع يسمح لي بإحياء طرق الذكاء الاصطناعي الرمزية القديمة هذه ، وتوسيع نطاقها بأوامر من حيث الحجم ، ومعرفة ما سيحدث. ربما ، ربما فقط ، سيفاجئنا أحدهم.
أول إنجاز لنا قيد الحركة بالفعل: لقد قمنا ببناء أسرع مركب للبرنامج / الدليل في العالم ، والذي أسميه SupGen. أو NeoGen. أو QuickGen؟ سنصدرها كتحديث للغة "Bend" الخاصة بنا ، مما يجعلها متاحة للجمهور في أواخر أكتوبر تقريبا.
بعد ذلك ، في وقت لاحق من هذا العام ، سنستخدمه كأساس لبرنامج بحثي جديد ، بحثا عن بنية رمزية خالصة يمكنها في الواقع التعلم من البيانات وبناء التعميمات - ليس من خلال النسب المتدرج والانتشار الخلفي ، ولكن من خلال التفكير المنطقي وتوليف البرنامج.
ستكون تجاربنا الأولى بسيطة للغاية (لا تختلف عن GPT-2) ، وسيكون المعلم الرئيسي هو امتلاك "أداة إكمال الرمز المميز التالي" خالية بنسبة 100٪ من الشبكات العصبية.
إذا نجح هذا ، فقد يكون قفزة رائدة إلى ما وراء المحولات والتعلم العميق ، لأنه نهج جديد تماما من شأنه على الأرجح التخلص من العديد من القيود الموروثة ل GPT التي يواجهها الذكاء الاصطناعي اليوم. ليس فقط مشكلات الرمز المميز (مثل R في الفراولة) ، ولكن المشكلات الأساسية التي تمنع GPTs من التعلم بكفاءة والتعميم
الوهميه؟ ربما
تستحق المحاولة؟ مطلقا
(الآن خمن المقدار الذي تم إنشاؤه بواسطة الذكاء الاصطناعي ، والنموذج الذي استخدمته)
15.17K
بمجرد (إذا) يعمل الذكاء الاصطناعي الرمزي الأول ، سيكون منحنى جديدا تماما
لا حتى الادعاء بأنه سيكون جيدا ، لكنه منحنى جديد
أي حدس لدينا لتوسيع نطاق LLMs غير ذي صلة تماما هنا. قيود LLM غير ذات صلة أيضا. لا أحد يعرف ما قد يحدث

Amjad Masadمنذ 18 ساعةً
لا يسعني إلا أن أشعر بالوزن الساحق للعوائد المتناقصة. نحن بحاجة إلى منحنى S جديد.
15.14K
بمجرد (إذا) يعمل الذكاء الاصطناعي الرمزي الأول ، سيكون منحنى جديدا تماما
لا حتى الادعاء بأنه سيكون جيدا ، لكنه منحنى جديد
أي حدس لدينا لتوسيع نطاق LLMs غير ذي صلة تماما هنا. قيود LLM غير ذات صلة تماما هنا. لا أحد يعرف ما قد يحدث

Amjad Masadمنذ 18 ساعةً
لا يسعني إلا أن أشعر بالوزن الساحق للعوائد المتناقصة. نحن بحاجة إلى منحنى S جديد.
260
نعم ، لا يوجد نموذج في العالم يقترب من هذا
الذهاب للنوم 100٪ متأكد من أنني محق في حكمي
كما هو الحال دائما ، سيكون هذا قريبا منطقيا ، لكنني قلته أولا (:
وداعًا الآن

Taelinمنذ 23 ساعةً
أوه ، لقد لاحظت للتو أن حل GPT-5 مطابق لحل GPT-5
هذا لا يُصدق
36.28K
لا ، أنت مخطئ ، GPT-5 قفزة
أنا أضاعف هنا بنسبة 100٪
لم أكن أرغب في النشر بسرعة كبيرة والندم مرة أخرى ، لكنها حلت للتو مجموعة من مطالبات تصحيح الأخطاء الصعبة للغاية التي لم يتم حلها سابقا (بواسطة الذكاء الاصطناعي) ، ثم صممت لعبة Gameboy رائعة منقطة بمستوى من التفاصيل والجودة التي تتجاوز بوضوح أي شيء آخر رأيته على الإطلاق.
لا توجد طريقة لهذا النموذج سيء.
أعتقد أنكم جميعا مصابين بصدمة من مقاعد البدلاء ، وتبالغون في التعويض ضد نموذج جيد بالفعل. أعتقد أيضا أنك تقلل من شأن نقاط قوة gpt-oss (لكن نعم ، تم التعجيل بمشاركتي الأخيرة)
ما زلت لا أعرف ما إذا كان قابلا للاستخدام للبرمجة الجادة على الرغم من ذلك (لم يكن o3 كذلك) ، لكن يبدو ذلك؟ نموذج ترميز موثوق به مثل Opus ، ولكنه أكثر ذكاء من o3 ، سيغير سير عملي تماما. لا يحتاج Opus إلى التفكير ليكون رائعا ، لذلك قد يكون ذلك في صالحه.
لما يستحق ، لقد استخدمت 3 نماذج فقط:
- Opus 4.1 للترميز
- نادرا ما يكون الجوزاء 2.5 للترميز عندما يفشل Opus
- O3 لكل شيء ما عدا الترميز
86.09K
لا ، أنت مخطئ ، GPT-5 قفزة
أنا أضاعف هنا بنسبة 100٪
لم أكن أرغب في النشر بسرعة كبيرة والندم مرة أخرى ، لكنها حلت للتو مجموعة من مطالبات تصحيح الأخطاء الصعبة للغاية التي لم يتم حلها سابقا (بواسطة الذكاء الاصطناعي) ، ثم صممت لعبة Gameboy رائعة منقطة بمستوى من التفاصيل والجودة التي تتجاوز بوضوح أي شيء آخر رأيته على الإطلاق.
لا توجد طريقة لهذا النموذج سيء.
أعتقد أنكم جميعا مصابين بصدمة من مقاعد البدلاء ، وتبالغون في التعويض ضد نموذج جيد حقا. أعتقد أيضا أنك تقلل من شأن نقاط قوة gpt-oss (لكن نعم ، تم التعجيل بمشاركتي الأخيرة)
ما زلت لا أعرف ما إذا كان قابلا للاستخدام للبرمجة الجادة على الرغم من ذلك (4o ، o3 بالتأكيد لم يكن كذلك) ، لكن يبدو ذلك؟ نموذج ترميز موثوق به مثل Opus ، ولكنه أكثر ذكاء من o3 ، سيغير سير عملي تماما. لا يحتاج Opus إلى التفكير ليكون رائعا ، لذلك قد يكون ذلك في صالحه.
لما يستحق ، لقد استخدمت 3 نماذج فقط:
- Opus 4.1 للترميز
- نادرا ما يكون الجوزاء 2.5 للترميز عندما يفشل Opus
- O3 لكل شيء ما عدا الترميز
601
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز