Publication: Online Caching Policy with User Preferences and Time-Dependent Requests: A Reinforcement Learning Approach.