Publication: Adaptive aggregation for reinforcement learning in average reward Markov decision processes.