Unlock the Correlation between Supervised Fine-Tuning and Reinforcement Learning in Training Code Large Language Models.

Published in: CoRR (2024)

Keyphrases