DRLC: Reinforcement Learning with Dense Rewards from LLM Critic.

Meng Cao Lei Shu Lei Yu Yun Zhu Nevan Wichers Yinxiao Liu Lei Meng

Published in: CoRR (2024)

Keyphrases