A reinforcement learning method using a dynamic reinforcement function based on action selection probability.

Published in: Systems and Computers in Japan (2007)

Keyphrases