Counterfactual Influence in Markov Decision Processes.

Milad Kazemi Jessica Lally Ekaterina Tishchenko Hana Chockler Nicola Paoletti

Published in: CoRR (2024)

Keyphrases

markov decision processes
optimal policy
state space
finite state
reinforcement learning
policy iteration
decision theoretic planning
dynamic programming
transition matrices
reachability analysis
infinite horizon
reinforcement learning algorithms
markov decision process
average reward
reward function
factored mdps
decision processes
finite horizon
action space
planning under uncertainty
average cost
model based reinforcement learning
partially observable
real valued
partially observable markov decision processes
multi agent
state and action spaces
action sets
discounted reward
machine learning