Controllable Summarization with Constrained Markov Decision Process.

Hou Pong Chan Lu Wang Irwin King

Published in: Trans. Assoc. Comput. Linguistics (2021)

Keyphrases

markov decision process
state space
optimal policy
markov decision processes
reinforcement learning
infinite horizon
finite horizon
temporal difference learning
transition matrices
policy iteration
partial observability
initial state
reward function
transition probabilities
supply chain
hidden markov models
control system