Align-RUDDER: Learning From Few Demonstrations by Reward Redistribution.

Vihang P. Patil Markus Hofmarcher Marius-Constantin Dinu Matthias Dorfer Patrick M. Blies Johannes Brandstetter José Antonio Arjona-Medina Sepp Hochreiter

Published in: ICML (2022)

Keyphrases