Regret Lower Bound and Optimal Algorithm in Dueling Bandit Problem.

Junpei Komiyama Junya Honda Hisashi Kashima Hiroshi Nakagawa

Published in: COLT (2015)

Keyphrases