Jeder, der ‚kontinuierliches Lernen‘ als Problem erwähnt, spricht normalerweise nur über die Stichproben-Effizienz. Offensichtlich solltest du ‚kontinuierlich lernen‘, indem du kontinuierlich Trajektorien wieder ins Modell trainierst! Es gibt kein Geheimnis: Das funktioniert einfach nicht mit niedriger Stichproben-Effizienz.
77,73K