Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Há 1 década: Engenheiro Imediato de Aprendizagem por Reforço na Secção 5.3 de «Aprender a Pensar...» [2]. Cadeia de pensamento adaptativa! Uma rede RL aprende a consultar outra rede para raciocínio abstrato e tomada de decisão. Ir além do Modelo Mundial de 1990 para o planeamento de milissegundos por milissegundos [1].
[2] J. Schmidhuber (JS, 2015). «Sobre Aprender a Pensar: Teoria da Informação Algorítmica para Novas Combinações de Controladores RL e Modelos de Mundo Neural Recorrentes.» ArXiv 1210.0118
[1] JS (1990). "Tornando o mundo diferenciável: sobre o uso de redes neurais autosupervisionadas totalmente recorrentes para aprendizagem e planejamento de reforço dinâmico em ambientes não estacionários." TR FKI-126-90, TUM. (Este relatório também introduziu curiosidade artificial e motivação intrínseca através de redes generativas adversariais.)

24,22K
Top
Classificação
Favoritos