Publication: Full Gradient Deep Reinforcement Learning for Average-Reward Criterion.