لدفع حدود المصدر المفتوح ل RL + LLMs ، نحتاج إلى بيئات معيارية قابلة للتطوير مع تعقيد في العالم الحقيقي ، بما يتجاوز معايير الرياضيات. اليوم ، نقوم بإصدار * benchmax *. إطار عمل مفتوح المصدر لبناء وتشغيل وتوسيع نطاق RL envs مفيدة لضبط LLM ، مع عمليات تكامل مع verl & verifiers (المزيد قريبا!).
‏‎10.6‏K