Optimizing Warfarin Dosing using Deep Reinforcement Learning.

Sadjad Anzabi Zadeh W. Nick Street Barrett W. Thomas

Published in: CoRR (2022)

Keyphrases

reinforcement learning
function approximation
deep learning
multi agent reinforcement learning
temporal difference
machine learning
artificial intelligence
state space
optimal policy
markov decision processes
optimal control
model free
robotic control
control problems
partially observable
learning capabilities
data sets
action selection
reinforcement learning algorithms
direct policy search
perceptual aliasing
transition model
exploration exploitation tradeoff
temporal difference learning
learning agents
robot control
multi agent
neural network