Value Penalized Q-Learning for Recommender Systems.

Chengqian Gao Ke Xu Kuangqi Zhou Lanqing Li Xueqian Wang Bo Yuan Peilin Zhao

Published in: SIGIR (2022)

Keyphrases