todos los que mencionan ‘aprendizaje continuo’ como un problema generalmente solo están hablando de la eficiencia de muestra. claramente, deberías ‘aprender continuamente’ entrenando continuamente trayectorias de nuevo en el modelo! no hay misterio: esto simplemente no funciona con baja eficiencia de muestra.
77.73K