Deep Reinforcement Learning for List-wise Recommendations.

Xiangyu Zhao Liang Zhang Zhuoye Ding Dawei Yin Yihong Zhao Jiliang Tang

Published in: CoRR (2018)

Keyphrases

reinforcement learning
recommender systems
function approximation
pairwise
state space
robotic control
reinforcement learning algorithms
model free
deep learning
dynamic programming
markov decision processes
reinforcement learning methods
learning algorithm
learning process
web search
optimal policy
dynamical systems
ranked list
multi agent
user feedback
recommendation systems
robot control