On Reinforcement Learning and Distribution Matching for Fine-Tuning Language Models with no Catastrophic Forgetting.

Published in: NeurIPS (2022)

Keyphrases