Woulda, Coulda, Shoulda: Counterfactually-Guided Policy Search.

Lars Buesing Theophane Weber Yori Zwols Sébastien Racanière Arthur Guez Jean-Baptiste Lespiau Nicolas Heess

Published in: CoRR (2018)

Keyphrases