Adversarial Exploitation of Policy Imitation.

Vahid Behzadan William H. Hsu

Published in: AISafety@IJCAI (2019)

Keyphrases

optimal policy
reinforcement learning
asymptotically optimal
database
real world
data mining
search engine
multi agent
markov decision processes
expected cost
policy makers