Publication: Reward-Free Policy Space Compression for Reinforcement Learning.