Brendan O'Donoghue - Research Profile & CoRR Publications | Reviewer.ly

Filter dates

All Last 5 Years Last 10 Years

-

Overview

reinforcement learning
markov decision processes
bucket elimination
variational bayesian
regret bounds

Publications

Efficient Exploration via Epistemic-Risk-Seeking Policy Optimization.

Probabilistic Inference in Reinforcement Learning Done Right.

Efficient exploration via epistemic-risk-seeking policy optimization.

Optimistic Meta-Gradients.

ReLOAD: Reinforcement Learning with Optimistic Ascent-Descent for Last-Iterate Convergence in Constrained MDPs.

Probabilistic Inference in Reinforcement Learning Done Right.

Similar Experts