Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Nous Research delade inlägget
Arena-Hard eval-miljön är nu sammanslagen med Atropos - njut av skalbar, flexibel och modern utvärdering med @lmsysorg:s arena-hard benchmark som är mycket bra på att bestämma ett brett spektrum av förmågor i modeller.
Redo att vara en RL-miljö om du tar med ditt eget tågset också :)
Läs mer på

6,78K
Vår Researcher in Residence @yaboilyrical kommer att diskutera sitt arbete med SMC-styrning vid UC Berkeley den 3 augusti.
Kolla in bloggen om detta arbete här:
Detaljer nedan!

nightwing25 juli 2025
Jag är glad att kunna meddela att jag kommer att vara en av talarna på @BerkeleyRDI DeAI Summit och presentera min forskning med @NousResearch om begränsad språkavkodning!
Om du ska delta i toppmötet, eller vill komma och se mitt föredrag, vänligen kontakta mig!

10,54K
Atropos v0.3 är nu ute!
Vårt ramverk för RL-miljöer har sett många uppgraderingar sedan v0.2 - några höjdpunkter:
- Atropos kan nu användas som ett ramverk för benchmarking och utvärdering av @rogershijin, med vår första externa benchmark, Reward-Bench 2!
- Lade till Reasoning Gym, ett repo för gym i extern miljö som överfördes till atropos med över 100 resonemangsuppgifter av @neurosp1ke och vänner
- @max_paperclips integrerade @intern_lm:s resonemang bootcamp och lade till 1000+ nya resonemangsuppgifter för RL
- @dmayhem93 lade Atropos chefsingenjör till dussintals buggfixar och andra förbättringar av tillförlitlighet och kompatibilitet, bättre stöd för flera miljöer och CI/CD
- Många av Atropos hackathon-miljöer har slagits ihop till /environments/community - att lista dem alla skulle ta upp det mesta av skärmutrymmet, men några höjdpunkter:
VR-CLI av @JakeABoggs, filosofi RLAIF, adaptiva LLM-lärare, WebVoyager, proteindesign av @hallerite, en modellroutingmiljö av @gabinfay, flera på lean proving, catbot arena, pokemon showdown, poker, hjälpsamma läkare, sanskritpoesi av @khoomeik och så mycket mer!
- Andra viktiga nya miljöer som stöds officiellt är:
Svarsformat följande miljö
Pydantic till JSON-miljö porterad från @MatternJustus arbete
Instruktion Följer portat från @natolambert och @allen_ai arbete
Räkning av bokstäver
- 47 helt nya bidragsgivare!
Kolla in hela ändringsloggen här:

Teknium (e/λ)18 juli 2025
Har precis slagit ihop en PR för en miljö för att förbättra LLM som domare samt utvärdera modeller på deras förmåga att göra domar!
Visste du att alla verifierbara RL-miljöer är nästan likvärdiga med riktmärken (och vice versa!)? Så vi lade till ett evaluate-kommando till Atropos bas och nu kan du köra benchmarks genom Atropos-miljöer.
Vi blev frustrerade över att arbeta med så många benchmark-ramverk som var föråldrade eller oanvändbara, så vi implementerade endast utvärdering-läge i Atropos, vårt ramverk för RL-miljöer.
Så vår första port utanför våra befintliga miljöer var @natolambert's Reward-Bench!
Obs: den stöder endast generativa belöningsmodeller (vanliga LLM-domare) för tillfället.
Kolla in PR här:

25,03K
Nous Research delade inlägget
Det var roligt att arbeta med @huggingface-teamet för att göra den här funktionen till verklighet! Tack för allt ditt arbete och kreativitet @pcuenq @reach_vb @julien_c @ariG23498!
Tack också till @NousResearch @Teknium1 @Euclaise_ för att de var tidiga användare av bärbara datorer med anpassade modeller och arbetade med detta med oss!
31,42K
Topp
Rankning
Favoriter
Trendande på kedjan
Trendande på X
Senaste toppfinansieringarna
Mest anmärkningsvärda