تم إطلاق GPT-5 أمس. 94.6٪ في AIME 2025. 74.9٪ على مقاعد البدلاء السويدية. عندما نقترب من الحدود العليا لهذه المعايير ، فإنها تموت. ما يجعل GPT-5 والجيل القادم من النماذج ثورية ليس معرفتهم. إنها معرفة كيفية التصرف. بالنسبة إلى GPT-5 ، يحدث هذا على مستويين. أولا ، تحديد النموذج الذي يجب استخدامه. ولكن ثانيا ، والأهم من ذلك ، من خلال استدعاء الأدوات. لقد كنا نعيش في عصر أتقن فيه LLMs استرجاع المعرفة وإعادة تجميعها. يعد البحث والترميز للمستهلكين ، والتطبيقات القاتلة الأولية ، تحديات استرجاع المعرفة بشكل أساسي. كلاهما ينظم المعلومات الموجودة بطرق جديدة. لقد تسلقنا تلك التلال ونتيجة لذلك أصبحت المنافسة أكثر حدة من أي وقت مضى. تتلاقى نماذج Anthrobic و OpenAI و Google على قدرات مماثلة. تستمر النماذج الصينية والبدائل مفتوحة المصدر في الاقتراب أكثر من أي وقت مضى من أحدث ما توصلت إليه التكنولوجيا يمكن للجميع استرداد المعلومات. يمكن للجميع إنشاء نص. محور المنافسة الجديد؟ استدعاء الأدوات. يحول استدعاء الأدوات LLMs من مستشارين إلى ممثلين. إنه يعوض عن ضعفين مهمين في النموذج لا تستطيع نماذج اللغة البحتة التغلب عليهما. أولا ، تنسيق سير العمل. تتفوق النماذج في الاستجابات أحادية اللقطة ولكنها تكافح مع عمليات متعددة الخطوات ذات الحالة. تمكنهم الأدوات من إدارة مهام سير العمل الطويلة وتتبع التقدم ومعالجة الأخطاء والحفاظ على السياق عبر عشرات العمليات. ثانيا ، تكامل النظام. يعيش LLMs في عالم نصي فقط. تتيح لهم الأدوات التفاعل بشكل متوقع مع الأنظمة الخارجية مثل قواعد البيانات وواجهات برمجة التطبيقات وبرامج المؤسسات ، مما يحول اللغة الطبيعية إلى إجراءات قابلة للتنفيذ. في الشهر الماضي ، قمت ببناء 58 أداة الذكاء الاصطناعي المختلفة. معالجات البريد الإلكتروني. تكامل CRM. محدثات الفكرة. مساعدو البحوث. تعمل كل أداة على توسيع إمكانات النموذج إلى مجال جديد. أهم قدرة على الذكاء الاصطناعي هي اختيار الأداة المناسبة بسرعة وبشكل صحيح. كل خطوة تم توجيهها بشكل خاطئ تقتل سير العمل بأكمله. عندما أقول "اقرأ هذا البريد الإلكتروني من Y Combinator وابحث عن جميع الشركات الناشئة غير الموجودة في CRM" ، فإن LLMs الحديثة تنفذ تسلسلا معقدا. يحل أمر واحد باللغة الإنجليزية محل سير العمل بأكمله. وهذا مجرد واحد بسيط. والأفضل من ذلك ، أن النموذج ، الذي تم إعداده بشكل صحيح باستخدام الأدوات المناسبة ، يمكنه التحقق من عمله الخاص بأن المهام قد اكتملت في الوقت المحدد. تخلق حلقة التحقق الذاتي هذه موثوقية في مهام سير العمل يصعب تحقيقها بطريقة أخرى. اضرب هذا عبر مئات الموظفين. الآلاف من مهام سير العمل. تتراكم مكاسب الإنتاجية بشكل كبير. سيكون الفائزون في عالم الذكاء الاصطناعي المستقبلي هم الأكثر تعقيدا في تنسيق الأدوات وتوجيه الاستعلامات الصحيحة. كل مرة. بمجرد أن تكون مهام سير العمل هذه قابلة للتنبؤ ، عندها سنصبح جميعا مديري وكلاء
‏‎3.19‏K