Semi-Offline Reinforcement Learning for Optimized Text Generation.

Changyu Chen Xiting Wang Yiqiao Jin Victor Ye Dong Li Dong Jie Cao Yi Liu Rui Yan

Published in: CoRR (2023)

Keyphrases

text generation
reinforcement learning
natural language generation
natural language
function approximation
multi agent
real time
model free
learning algorithm
dynamic programming
state space
robotic control
reinforcement learning algorithms
markov decision processes
machine learning
multi agent reinforcement learning
machine translation
optimal control
transfer learning
optimal policy
intelligent systems
learning agent
temporal difference learning
learning process
expert systems
transition model
genetic algorithm