In-Context Policy Iteration.

Ethan A. Brooks Logan Walls Richard L. Lewis Satinder Singh

Published in: CoRR (2022)

Keyphrases

policy iteration
markov decision processes
reinforcement learning
fixed point
optimal policy
model free
sample path
least squares
learning algorithm
image segmentation
search space
state space
linear programming