search
search
reviewers
reviewers
feeds
feeds
assignments
assignments

settings
logout

Sublinear Optimal Policy Value Estimation in Contextual Bandits.

Weihao Kong Emma Brunskill Gregory Valiant

Published in: AISTATS (2020)