Modelos de recompensas afins na fronteira de Pareto sobre um conjunto em constante expansão de ambientes de RL. Venha aprimorar suas habilidades minerando modelos em ambientes de RL. Ou crie uma subnet que introduza modelos neste mercado.
Florian S
Florian S1/08, 23:02
Ok, isto é bastante 🤯 Affine por @const_reborn é basicamente uma criptomoeda que é minerada "aplicando o melhor RL a um modelo". O minerador cuja variante de modelo lidera a tabela de classificação recebe as emissões. @willccbb: deves usar a tua magia para ganhar algo aqui? @drishanarora: aplicar IDA?
10,45K