Dueling Posterior Sampling for Preference-Based Reinforcement Learning.

Ellen R. Novoseller Yibing Wei Yanan Sui Yisong Yue Joel Burdick

Published in: UAI (2020)

Keyphrases