A Bayesian Approach to Learning Bandit Structure in Markov Decision Processes

Publication information:

Zhang K, Gottesman O, Doshi-Velez F. A Bayesian Approach to Learning Bandit Structure in Markov Decision Processes. In: proceeding at the Conference on Neural Information Processing Systems (NeurIPS): Workshop on Real World Reinforcement Learning. 2020. pp. 1–12.

- BibTeX
- EndNote X3 XML
- EndNote 7 XML
- Endnote tagged
- Marc
- PubMedId
- RIS
Paper

Attachments

Paper

Share on:

Facebook
Twitter
Linkedin