Abychom posunuli hranice open source pro RL + LLM, potřebujeme škálovatelná, modulární prostředí se složitostí reálného světa, která přesahuje matematické benchmarky. Dnes vydáváme *benchmax*. Open-source framework pro vytváření, provoz a škálování užitečných RL envs pro doladění LLM, s integracemi do verl & verifiers (více již brzy!).
10,6K