On the Expressivity of Markov Reward.

David Abel Will Dabney Anna Harutyunyan Mark K. Ho Michael L. Littman Doina Precup Satinder Singh

Published in: CoRR (2021)

Keyphrases

reinforcement learning
markov chain
semi markov
markov model
conditional independence
long run
bandit problems
genetic algorithm
website
markov processes
markov process
computational properties
directed acyclic graph
average reward
reward function
data sets
evolutionary algorithm
relational databases
computational complexity
database systems
three dimensional
real world