Dyadic Reinforcement Learning.

Shuangning Li Lluis Salvat Niell Sung Won Choi Inbal Nahum-Shani Guy Shani Susan A. Murphy

Published in: CoRR (2023)

Keyphrases

reinforcement learning
function approximation
state space
markov decision processes
model free
optimal policy
control problems
reinforcement learning algorithms
multi agent
learning process
temporal difference learning
learning problems
transition model
reinforcement learning methods
markov decision process
partially observable
temporal difference
machine learning
supervised learning
mobile robot
multiresolution
decision trees