Fine-tuning Reinforcement Learning Models is Secretly a Forgetting Mitigation Problem.

Maciej Wolczyk Bartlomiej Cupial Mateusz Ostaszewski Michal Bortkiewicz Michal Zajac Razvan Pascanu Lukasz Kucinski Piotr Milos

Published in: CoRR (2024)

Keyphrases