Trust Region Policy Optimisation in Multi-Agent Reinforcement Learning.

Jakub Grudzien Kuba Ruiqing Chen Muning Wen Ying Wen Fanglei Sun Jun Wang Yaodong Yang

Published in: CoRR (2021)