Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Nous Research ha ripubblicato
L'ambiente di valutazione Arena-Hard è ora integrato in Atropos - goditi una valutazione scalabile, flessibile e moderna con il benchmark arena-hard di @lmsysorg, che è molto efficace nel determinare una vasta gamma di capacità nei modelli.
Pronto per essere un ambiente RL se porti il tuo set di addestramento! :)
Scopri di più su

6,78K
Il nostro Ricercatore in Residenza @yaboilyrical discuterà del suo lavoro sulla guida SMC all'UC Berkeley il 3 agosto.
Dai un'occhiata al blog su questo lavoro qui:
Dettagli qui sotto!

nightwing25 lug 2025
sono entusiasta di annunciare che sarò relatore al DeAI Summit di @BerkeleyRDI, presentando la mia ricerca con @NousResearch sul decoding del linguaggio vincolato!
se parteciperai al summit, o vuoi venire a vedere il mio intervento, contattami!

10,51K
Atropos v0.3 è ora disponibile!
Il nostro framework per ambienti RL ha visto molti aggiornamenti dalla v0.2 - alcuni punti salienti:
- Atropos può ora essere utilizzato come framework di benchmarking e valutazioni da @rogershijin, con il nostro primo benchmark esterno, Reward-Bench 2!
- Aggiunto il Reasoning Gym, un repository di ambienti esterni portato in Atropos con oltre 100 compiti di ragionamento da @neurosp1ke e amici.
- @max_paperclips ha integrato il bootcamp di ragionamento di @intern_lm, aggiungendo oltre 1000 nuovi compiti di ragionamento per RL.
- @dmayhem93, l'ingegnere capo di Atropos, ha aggiunto dozzine di correzioni di bug e altri miglioramenti di affidabilità e compatibilità, un migliore supporto per ambienti multipli e CI/CD.
- Molti degli ambienti hackathon di Atropos sono stati fusi in /environments/community - elencarli tutti occuperebbe gran parte dello spazio dello schermo, ma alcuni punti salienti:
VR-CLI di @JakeABoggs, Filosofia RLAIF, Insegnanti LLM Adattivi, WebVoyager, progettazione di proteine da @hallerite, un ambiente di routing dei modelli di @gabinfay, prove lean multiple, l'arena catbot, pokemon showdown, poker, dottori utili, poesia sanscrita di @khoomeik e molto altro!
- Altri nuovi ambienti ufficialmente supportati includono:
Formato di risposta seguente ambiente
Ambiente Pydantic a JSON portato dal lavoro di @MatternJustus
Seguire le istruzioni portato dal lavoro di @natolambert e @allen_ai
Conteggio lettere
- 47 nuovi collaboratori!
Controlla il changelog completo qui:

Teknium (e/λ)18 lug 2025
Abbiamo appena fuso una PR per un ambiente per migliorare LLM come Giudice e valutare i modelli sulla loro capacità di fare giudizi!
Sapevi che tutti gli ambienti RL verificabili sono quasi equivalenti ai benchmark (e viceversa!)? Quindi abbiamo aggiunto un comando di valutazione alla base di Atropos e ora puoi eseguire benchmark attraverso gli ambienti di Atropos.
Ci siamo frustrati nel lavorare con così tanti framework di benchmark che erano obsoleti o inutilizzabili, quindi abbiamo implementato una modalità di sola valutazione in Atropos, il nostro framework per ambienti RL.
Quindi il nostro primo porting da ambienti esterni è stato il Reward-Bench di @natolambert!
Nota: al momento supporta solo modelli di ricompensa generativa (Giudici LLM regolari).
Dai un'occhiata alla PR qui:

25,01K
Nous Research ha ripubblicato
È stato divertente lavorare con il team di @huggingface per trasformare questa funzione in realtà! Grazie per tutto il tuo lavoro e la tua creatività @pcuenq @reach_vb @julien_c @ariG23498 !
Grazie anche a @NousResearch @Teknium1 @Euclaise_ per essere stati i primi ad adottare i notebook per modelli personalizzati e per aver lavorato su questo con noi!
31,42K
Principali
Ranking
Preferiti
On-chain di tendenza
Di tendenza su X
Principali fondi recenti
Più popolari