Adversarial Batch Inverse Reinforcement Learning: Learn to Reward from Imperfect Demonstration for Interactive Recommendation.

Published in: CSCWD (2024)

Keyphrases