Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Nous Research republicou
O ambiente de avaliação Arena-Hard foi agora integrado ao Atropos - desfrute de uma avaliação escalável, flexível e moderna com o benchmark arena-hard da @lmsysorg, que é excelente para determinar uma ampla gama de capacidades em modelos.
Pronto para ser um ambiente RL se você trouxer seu próprio conjunto de treino também :)
Saiba mais em

6,78K
O nosso Investigador em Residência @yaboilyrical estará a discutir o seu trabalho sobre a direção SMC na UC Berkeley no dia 3 de agosto.
Veja o blog sobre este trabalho aqui:
Detalhes abaixo!

nightwing25/07/2025
estou entusiasmado para anunciar que serei um orador no @BerkeleyRDI DeAI Summit, apresentando minha pesquisa com @NousResearch sobre decodificação de linguagem restrita!
se você estiver a participar do summit, ou quiser vir ver a minha palestra, por favor entre em contacto comigo!

10,54K
Atropos v0.3 já está disponível!
O nosso framework de Ambientes RL teve muitas atualizações desde a v0.2 - alguns destaques:
- Atropos agora pode ser usado como um framework de benchmarking e avaliações por @rogershijin, com o nosso primeiro benchmark externo, Reward-Bench 2!
- Adicionado o Reasoning Gym, um repositório de ambientes externos portado para Atropos com mais de 100 tarefas de raciocínio por @neurosp1ke e amigos
- @max_paperclips integrou o bootcamp de raciocínio de @intern_lm, adicionando mais de 1000 novas tarefas de raciocínio para RL
- @dmayhem93, o engenheiro principal do Atropos, adicionou dezenas de correções de bugs e outras melhorias de confiabilidade e compatibilidade, melhor suporte para múltiplos ambientes e CI/CD
- Muitos dos ambientes do hackathon Atropos foram fundidos em /environments/community - listar todos ocuparia a maior parte do espaço da tela, mas alguns destaques:
VR-CLI por @JakeABoggs, Filosofia RLAIF, Professores LLM Adaptativos, WebVoyager, design de proteínas por @hallerite, um ambiente de roteamento de modelos por @gabinfay, múltiplas provas lean, a arena catbot, pokemon showdown, poker, médicos úteis, poesia sânscrita por @khoomeik e muito mais!
- Outros novos ambientes oficialmente suportados incluem:
Formato de resposta seguindo o ambiente
Ambiente Pydantic para JSON portado do trabalho de @MatternJustus
Seguindo Instruções portado do trabalho de @natolambert e @allen_ai
Contagem de Letras
- 47 novos colaboradores!
Confira o changelog completo aqui:

Teknium (e/λ)18/07/2025
Acabámos de fundir um PR para um ambiente que melhora o LLM como Juiz, bem como avalia modelos na sua capacidade de fazer julgamentos!
Sabia que todos os ambientes RL verificáveis são quase equivalentes a benchmarks (e vice-versa!)? Por isso, adicionámos um comando de avaliação à base do Atropos e agora pode executar benchmarks através dos ambientes do Atropos.
Ficámos frustrados por trabalhar com tantos frameworks de benchmark que estavam desatualizados ou inutilizáveis, por isso implementámos um modo apenas de avaliação no Atropos, o nosso framework de ambientes RL.
Assim, o nosso primeiro porto a partir dos nossos ambientes existentes foi o Reward-Bench do @natolambert!
Nota: neste momento, apenas suporta modelos de recompensa generativa (Juízes LLM regulares).
Veja o PR aqui:

25,03K
Nous Research republicou
Foi divertido trabalhar com a equipa @huggingface para tornar esta funcionalidade uma realidade! Obrigado por todo o seu trabalho e criatividade @pcuenq @reach_vb @julien_c @ariG23498!
Também obrigado a @NousResearch @Teknium1 @Euclaise_ por serem os primeiros a adotar modelos de notebooks personalizados e trabalhar nisso conosco!
31,42K
Top
Classificação
Favoritos
Tendências on-chain
Popular no X
Principais financiamentos atuais
Mais notável