Is RLHF More Difficult than Standard RL?

Yuanhao Wang Qinghua Liu Chi Jin

Published in: CoRR (2023)

Keyphrases

reinforcement learning
real time
cooperative
markov decision processes
computer vision
knowledge base
case study
optimal solution
expert systems