المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
"حتى النماذج الحدودية تكافح للتحديث إلى ما هو أبعد من التدريب المسبق ، بغض النظر عن مدى إقناع الأدلة الجديدة."
نقوم بتدريب طلاب الدكتوراه على القيام بذلك! هل يمكن للمحولات القيام بذلك دون تغيير أوزانها؟


8 أغسطس، 07:29
هل التفكير في سلسلة التفكير في LLMs سراب؟
... تكشف نتائجنا أن منطق CoT هو سراب هش يختفي عندما يتم دفعه إلى ما هو أبعد من توزيعات التدريب. يقدم هذا العمل فهما أعمق لسبب ومتى يفشل منطق CoT ، مع التأكيد على التحدي المستمر المتمثل في تحقيق منطق حقيقي وقابل للتعميم.
... تكشف النتائج التي توصلنا إليها أن منطق CoT يعمل بشكل فعال عند تطبيقه على التوزيع أو بالقرب منه
البيانات أثناء التوزيع ولكنها تصبح هشة وعرضة للفشل حتى في ظل تحولات التوزيع المعتدلة.
في بعض الحالات ، تولد LLMs خطوات تفكير بطلاقة ولكنها غير متسقة منطقيا. تشير النتائج إلى أن ما يبدو أنه تفكير منظم يمكن أن يكون سرابا ، ينبثق من أنماط محفوظة أو مقحمة في بيانات التدريب بدلا من الاستدلال المنطقي.
... تشير هذه النتائج معا إلى أن LLMs ليست منطقية مبدئية بل هي محاكيات متطورة للنص الشبيه بالتفكير.

12.99K
الأفضل
المُتصدِّرة
التطبيقات المفضلة