Variance aware reward smoothing for deep reinforcement learning.

Yunlong Dong Shengjun Zhang Xing Liu Yu Zhang Tan Shen

Published in: Neurocomputing (2021)

Keyphrases