Learning reward functions from diverse sources of human feedback: Optimally integrating demonstrations and preferences.

Published in: Int. J. Robotics Res. (2022)

Keyphrases