Variance-aware decision making with linear function approximation under heavy-tailed rewards.

Xiang Li Qiang Sun

Published in: Trans. Mach. Learn. Res. (2024)

Keyphrases

function approximation
heavy tailed
reinforcement learning
temporal difference learning algorithms
decision making
von mises
function approximators
temporal difference
generalized gaussian
learning tasks
action selection
markov decision processes
supervised learning
radial basis function
prior distribution
neural network
unsupervised learning
data mining