Dynamic selection of wireless/powerline links using Markov Decision Processes.

Dacfey Dzung Yvonne-Anne Pignolet

Published in: SmartGridComm (2013)

Keyphrases

markov decision processes
state space
reinforcement learning
finite state
optimal policy
dynamic programming
policy iteration
reachability analysis
decision theoretic planning
reinforcement learning algorithms
finite horizon
action space
average cost
planning under uncertainty
transition matrices
average reward
reward function
factored mdps
markov decision process
state and action spaces
infinite horizon
model based reinforcement learning
risk sensitive
partially observable
decision processes
policy evaluation
state abstraction
discounted reward