Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Nous Research repostoval/a
Prostředí Arena-Hard eval je nyní sloučeno s Atropos - užijte si škálovatelné, flexibilní a moderní vyhodnocení s benchmarkem @lmsysorg arena-hard, který je velmi skvělý při určování široké škály schopností v modelech.
Připraveno být prostředím RL, pokud si přinesete vlastní vlakovou soupravu i :)
Více se dozvíte na

6,78K
Náš výzkumný pracovník v rezidenčním @yaboilyrical bude 3. srpna diskutovat o své práci na řízení SMC na UC Berkeley.
Podívejte se na blog o této práci zde:
Podrobnosti níže!

nightwing25. 7. 2025
S potěšením oznamuji, že budu řečníkem na @BerkeleyRDI DeAI Summitu, kde představím svůj výzkum s @NousResearch o dekódování omezeného jazyka!
Pokud se účastníte summitu, nebo se chcete přijít podívat na mou přednášku, kontaktujte mě!

10,53K
Atropos v0.3 je nyní venku!
Náš framework RL Environments prošel od verze 0.2 mnoha vylepšeními - některé přednosti:
- Atropos může být nyní použit jako rámec pro benchmarking a hodnocení společností @rogershijin, s naším prvním externím benchmarkem, Reward-Bench 2!
- Přidán Reasoning Gym, repo posilovny pro externí prostředí portované do atropos s více než 100 úlohami uvažování od @neurosp1ke a přátel
- @max_paperclips integrovaný bootcamp uvažování @intern_lm, který přidává 1000+ nových úkolů pro RL
- @dmayhem93 hlavní inženýr Atroposu přidal desítky oprav chyb a další vylepšení spolehlivosti a kompatibility, lepší podporu pro multi-environment a CI/CD
- Mnoho prostředí hackathonu Atropos bylo sloučeno do /environments/community - jejich seznam by zabral většinu místa na obrazovce, ale některé zajímavosti:
VR-CLI od @JakeABoggs, Filozofie RLAIF, Adaptivní učitelé LLM, WebVoyager, design proteinů od @hallerite, modelové směrovací prostředí od @gabinfay, více na štíhlé dokazování, catbot aréna, pokémon showdown, poker, užitečné doktory, sanskrtská poezie od @khoomeik a mnoho dalšího!
- Mezi další pozoruhodná oficiálně podporovaná nová prostředí patří:
Formát odpovědi podle prostředí
Prostředí Pydantic do JSON portované z @MatternJustus práce
Následující instrukce převzaté z práce @natolambert a @allen_ai
Počítání dopisů
- 47 zbrusu nových přispěvatelů!
Podívejte se na kompletní changelog zde:

Teknium (e/λ)18. 7. 2025
Právě jsem sloučil PR pro prostředí pro zlepšení LLM jako soudce a také hodnocení modelů na jejich schopnosti dělat úsudky!
Věděli jste, že všechna ověřitelná prostředí RL jsou téměř ekvivalentní benchmarkům (a naopak!)? Proto jsme do základu Atroposu přidali příkaz evaluate a nyní můžete spouštět benchmarky v prostředích Atropos.
Byli jsme frustrovaní z práce s tolika benchmarkovými frameworky, které byly zastaralé nebo nepoužitelné, a tak jsme implementovali režim pouze pro vyhodnocení do Atroposu, našeho frameworku RL prostředí.
Takže náš první port mimo naše stávající prostředí byl @natolambert's Reward-Bench!
Poznámka: v současné době podporuje pouze modely generativních odměn (běžné porotce LLM).
Podívejte se na PR zde:

25,02K
Nous Research repostoval/a
Byla zábava spolupracovat s týmem @huggingface na tom, aby se tato funkce stala realitou! Díky za veškerou vaši práci a kreativitu @pcuenq @reach_vb @julien_c @ariG23498 !
Také díky @NousResearch @Teknium1 @Euclaise_ za to, že jste si jako první osvojili vlastní modely notebooků a pracujete na tom s námi!
31,42K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější