Domain-Independent User Satisfaction Reward Estimation for Dialogue Policy Learning.

Stefan Ultes Pawel Budzianowski Iñigo Casanueva Nikola Mrksic Lina Maria Rojas-Barahona Pei-Hao Su Tsung-Hsien Wen Milica Gasic Steve J. Young

Published in: INTERSPEECH (2017)

Keyphrases