Aby przesunąć granice otwartego oprogramowania dla RL + LLM, potrzebujemy skalowalnych, modułowych środowisk o złożoności z rzeczywistego świata, wykraczających poza benchmarki matematyczne. Dziś wydajemy *benchmax*. Otwarte źródło framework do budowania, uruchamiania i skalowania użytecznych środowisk RL do fine-tuningu LLM, z integracjami do verl i weryfikatorów (więcej wkrótce!).
10,61K