DROID: Learning from Offline Heterogeneous Demonstrations via Reward-Policy Distillation.

Sravan Jayanthi Letian Chen Nadya Balabanska Van Duong Erik Scarlatescu Ezra Ameperosa Zulfiqar Haider Zaidi Daniel Martin Taylor Keith Del Matto Masahiro Ono Matthew C. Gombolay

Published in: CoRL (2023)