المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
من المثير للاهتمام أن فكرة تقييمات القدرات الخطرة نشأت لأول مرة في سياق حيث تم تثبيت الكثير من التعليقات العامة على الببغاوات العشوائية و "لا يمكن الذكاء الاصطناعي أن يولد أصابعا ، كيف يمكن أن يكون تهديدا يتجاوز التحيز؟"
لذلك كان من المنطقي جدا بناء إصدارات ألعاب ذات استخدامات ضارة لتوصيل ما هو ممكن بشكل أفضل ، لا سيما بالنظر إلى الحدس الصحيح من الأشخاص الذين يؤمنون بالسلامة بأن التقدم لن يتوقف عند هذا الحد: حتى لو فشلت أنظمة الذكاء الاصطناعي ، فسيكون من السهل إظهار أنها تتحسن بمرور الوقت.
تكمن المشكلة في أن هذا نجح بشكل جيد للغاية ونسي الناس جزء "نسخة اللعبة" من evals ، حيث أبلغت وسائل الإعلام عن "الابتزاز" أو النماذج التي تعمل بشكل جيد في MCQs الأساسية لعلم الفيروسات أو إنشاء رمز أساسي للبرامج الضارة كصفقات ضخمة - لم تكن كذلك.
لكن بالطبع أحب العديد من المدافعين استخدامها لتوضيح سبب الحاجة إلى التنظيم أكثر من أي وقت مضى ، أو المبالغة في مدى سوء الأمور (الميمات "هذا جيد" وما إلى ذلك). قدم الناس ادعاءات مشكوك فيها حول "النماذج الخطرة" ، مدفوعة بالنفور العميق من المخاطرة الذي يميز المجال.
منذ ذلك الحين ، نضج المجال وتبدو التقييمات أفضل ، ويرجع ذلك جزئيا إلى أن جانب السلامة كان عليه أن يتعامل فعليا مع خبراء المجال في السيرة الذاتية أو الإلكترونية بدلا من محاولة العمل على كل شيء من المبادئ الأولى. على الرغم من أنني ما زلت أجد العديد من القيم أساسية وثابتة وغير صالحة خارجيا - إلا أنها تظل مؤشرات مهمة.
لكن نماذج التهديد المحددة لا تزال قيد النقاش ، ولا يزال السؤال مفتوحا حول ما إذا كان الذكاء الاصطناعي سيغير ماديا توازن الدفاع عن الهجوم في الأمن السيبراني.
يعد تقرير Anthropic الأخير عملا رائعا ولكن لا يبدو أنه صفقة كبيرة من حيث أن هذه الأنواع من الهجمات شائعة إلى حد ما. من المؤكد أن هناك المزيد من الأتمتة التي يجب دراستها ، ولكن من الواضح أن هذا وحده سيكون هو الحال عند مستوى معين من الانتشار.
يجب أن تتوقع من الأشرار استخدام التكنولوجيا أيضا. ما يجب أن نراقبه هو ما إذا كان هذا يخلق عدم تناسق تدريجي ويزيد بشكل كبير من الأضرار / التكاليف / الفدية + إلى أي مدى يتم تقوية الدفاعات السيبرانية / البنية التحتية الحيوية بالتوازي. IMO يجب أن يكون لدينا مسبقون يفضلون "التوازن الفوضوي" على "ميزة الهجوم من جانب واحد".
الأفضل
المُتصدِّرة
التطبيقات المفضلة

