todo el mundo que menciona ‘aprendizaje continuo’ como un problema suele estar hablando de la eficiencia de muestra. claro, deberías ‘aprender continuamente’ entrenando continuamente trayectorias de nuevo en el modelo! no hay misterio: esto simplemente no funciona con baja eficiencia de muestra.
77,74K