Reinforcement Learning to Rank with Pairwise Policy Gradient.

Jun Xu Zeng Wei Long Xia Yanyan Lan Dawei Yin Xueqi Cheng Ji-Rong Wen

Published in: SIGIR (2020)

Keyphrases