Variational Quantum Soft Actor-Critic.

Published in: CoRR (2021)

Keyphrases

actor critic
reinforcement learning
approximate dynamic programming
policy gradient
optimal control
temporal difference
neuro fuzzy
gradient method
policy iteration
reinforcement learning algorithms
function approximation
image segmentation
optical flow
markov decision processes
model free
average reward
least squares
linear program
state space
evaluation function
learning algorithm
step size
monte carlo
optimal policy