Modelos de recompensas afines en la frontera de Pareto sobre un conjunto en expansión de entornos de RL. Ven a adquirir experiencia minando modelos en entornos de RL. O crea una subred que inyecte modelos en este mercado.
Florian S
Florian S1 ago, 23:02
Ok, esto es bastante 🤯 Affine de @const_reborn básicamente es una criptomoneda que se mina "aplicando el mejor RL a un modelo". El minero cuyo modelo variante encabeza la tabla de clasificación recibe las emisiones. @willccbb: ¿deberías usar tu magia para ganar algo aquí? @drishanarora: ¿aplicar IDA?
10.44K