Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Użytkownik Nous Research udostępnił ponownie
Środowisko oceny Arena-Hard zostało teraz połączone z Atropos - ciesz się skalowalną, elastyczną i nowoczesną oceną dzięki benchmarkowi arena-hard od @lmsysorg, który doskonale określa szeroki zakres możliwości modeli.
Gotowe, aby stać się środowiskiem RL, jeśli przyniesiesz własny zestaw treningowy :)
Dowiedz się więcej na

6,78K
Nasz badacz rezydent @yaboilyrical będzie omawiał swoją pracę nad kierowaniem SMC na UC Berkeley 3 sierpnia.
Sprawdź bloga na temat tej pracy tutaj:
Szczegóły poniżej!

nightwing25 lip 2025
z radością ogłaszam, że będę mówcą na szczycie DeAI @BerkeleyRDI, prezentując moje badania z @NousResearch na temat ograniczonego dekodowania języka!
jeśli wybierasz się na szczyt lub chcesz przyjść na moją prezentację, skontaktuj się ze mną!

10,53K
Atropos v0.3 jest już dostępny!
Nasz framework RL Environments przeszedł wiele ulepszeń od v0.2 - oto niektóre z nich:
- Atropos może teraz być używany jako framework do benchmarkingu i oceniania przez @rogershijin, z naszym pierwszym zewnętrznym benchmarkiem, Reward-Bench 2!
- Dodano Reasoning Gym, zewnętrzny repozytor środowisk gym przeniesiony do Atropos z ponad 100 zadaniami związanymi z rozumowaniem od @neurosp1ke i przyjaciół.
- @max_paperclips zintegrował bootcamp rozumowania @intern_lm, dodając ponad 1000 nowych zadań rozumowania dla RL.
- @dmayhem93, główny inżynier Atropos, dodał dziesiątki poprawek błędów oraz inne ulepszenia niezawodności i kompatybilności, lepsze wsparcie dla wielu środowisk oraz CI/CD.
- Wiele środowisk hackathonowych Atropos zostało połączonych w /environments/community - wymienienie ich wszystkich zajęłoby większość miejsca na ekranie, ale oto niektóre z nich:
VR-CLI od @JakeABoggs, Philosophy RLAIF, Adaptive LLM Teachers, WebVoyager, projektowanie białek od @hallerite, środowisko routingu modeli od @gabinfay, wiele na dowodzenie lean, arena catbota, pokemon showdown, poker, pomocni lekarze, poezja sanskrycka od @khoomeik i wiele więcej!
- Inne godne uwagi nowo dodane oficjalnie wspierane środowiska to:
Format odpowiedzi zgodny ze środowiskiem
Środowisko Pydantic do JSON przeniesione z pracy @MatternJustus
Podążanie za instrukcjami przeniesione z pracy @natolambert i @allen_ai
Liczenie liter
- 47 zupełnie nowych współpracowników!
Sprawdź pełną listę zmian tutaj:

Teknium (e/λ)18 lip 2025
Właśnie połączyłem PR dla środowiska, aby poprawić LLM jako Sędziego oraz oceniać modele pod kątem ich zdolności do wydawania wyroków!
Czy wiesz, że wszystkie weryfikowalne środowiska RL są niemal równoważne benchmarkom (i odwrotnie!)? Dlatego dodaliśmy polecenie oceny do podstawy Atropos i teraz możesz uruchamiać benchmarki przez środowiska Atropos.
Byliśmy sfrustrowani pracą z tak wieloma przestarzałymi lub nieużywalnymi frameworkami benchmarkowymi, więc wdrożyliśmy tryb tylko do oceny w Atropos, naszym frameworku środowisk RL.
Naszym pierwszym portem z zewnątrz naszych istniejących środowisk był Reward-Bench @natolambert!
Uwaga: obecnie obsługuje tylko generatywne modele nagród (zwykli Sędziowie LLM).
Sprawdź PR tutaj:

25,02K
Użytkownik Nous Research udostępnił ponownie
Fajnie było pracować z zespołem @huggingface, aby ta funkcja stała się rzeczywistością! Dziękujemy za całą Twoją pracę i kreatywność @pcuenq @reach_vb @julien_c @ariG23498 !
Podziękowania dla @NousResearch @Teknium1 @Euclaise_ za to, że jako pierwsi użytkownicy niestandardowych modeli notebooków i pracują nad tym z nami!
31,42K
Najlepsze
Ranking
Ulubione
Trendy onchain
Trendy na X
Niedawne największe finansowanie
Najbardziej godne uwagi