Mathematics of Online Decision Making

Program

Theory of Reinforcement Learning

Date

Monday, Oct. 26 – Friday, Oct. 30, 2020

Back to calendar

Oct. 23, 2020 Playlist: 25 videos

Mathematics of Online Decision Making

Oct. 30, 2020 0:29:56

Representation Learning and Exploration in Reinforcement Learning

Akshay Krishnamurthy (Microsoft Research)
https://simons.berkeley.edu/talks/representation-learning-and-exploration-reinforcement-learning
Mathematics of Online Decision Making

Visit talk page

Oct. 30, 2020 0:28:34

Corruption Robust Exploration in Episodic Reinforcement Learning

Aleksandrs Slivkins (Microsoft Research NYC)
https://simons.berkeley.edu/talks/corruption-robust-exploration-episodic-reinforcement-learning
Mathematics of Online Decision Making

Visit talk page

Oct. 30, 2020 0:34:40

On the Global Convergence and Approximation Benefits of Policy Gradient Methods

Daniel Russo (Columbia University)
https://simons.berkeley.edu/talks/global-convergence-and-approximation-benefits-policy-gradient-methods
Mathematics of Online Decision Making

Visit talk page

Oct. 30, 2020 0:30:42

An Alternative Softmax Operator for Reinforcement Learning

Michael Littman (Brown University)
An Alternative Softmax Operator for Reinforcement Learning
Mathematics of Online Decision Making

Visit talk page

Oct. 30, 2020 0:55:8

What Are the Statistical Limits of Offline Reinforcement Learning With Function Approximation?

Sham Kakade (University of Washington & Microsoft Research)
https://simons.berkeley.edu/talks/lower-bounds-batch-reinforcement-learning
Mathematics of Online Decision Making

Visit talk page