【强化学习笔记】ReinforcementLearningNotes.pdf资源-CSDN文库

深度学习

强化学习

需积分: 10 155 浏览量 2020-12-08 07:46:54 上传评论收藏 246KB PDF 举报

资源推荐

资源详情

资源评论

Reinforcement Learning

An Introductory Note

Jingye Wang

Ó wangjy5@shanghaitech.edu.cn

Spring 2020

Contents

1 Introduction 3

2 Review of Basic Probability 5

2.1 Interpretation of Probability . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.2 Transformations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.3 Limit eorem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.4 Sampling & Monte Carlo Methods . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.5 Basic Inequalities . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.6 Concentration Inequalities . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.7 Conditional Expectation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3 Bandit Algorithms 14

3.1 Bandit Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.2 Stochastic Bandits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.3 Greedy Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

3.4 UCB Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.5 ompson Sampling Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.6 Gradient Bandit Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

4 Markov Chains 20

4.1 Markov Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

4.2 Basic Computations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

4.3 Classications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

剩余52页未读，继续阅读

评论收藏

内容反馈

RobotLearn@ParisTech

粉丝: 0
资源: 11

【强化学习笔记】Reinforcement Learning Notes.pdf

最新资源

【强化学习笔记】Reinforcement Learning Notes.pdf

reinforcement-learning-notes:Sutton和Barto 2015年书籍《强化学习》的笔记和练习解决方案

reinforcement_learning_specialisation_notes:强化学习专家的笔记

Reinforcement-Learning-Notes:强化学习笔记，从MDP开始

leedeeprl-notes:李宏毅《深度强化学习》笔记，在线阅读地址：https

David-Silver-Reinforcement-learning：David Silver的“强化学习”课程注释以及各种算法的实现

强化学习方法汇总 (Reinforcement Learning)

Learning-Notes:学习笔记

Reinforcement_Learning:强化学习研究

强化学习导论（Reinforcement Learning）

Reinforcement-Learning:我的强化学习规范

matlab代码做游戏-Reinforcement-Learning-Notes-2:强化学习笔记2

DLNotes：深度学习笔记； Deep Learning Notes

机器学习笔记

DeepLearing-MuLi-Notes

paper-notes:与机器学习论文相关的笔记集

什么是强化学习? (Reinforcement Learning)

强化学习：简介Reinforcement Learning: An Introduction

1 why? (强化学习 Reinforcement Learning 教学)

Deep-Reinforcement-Learning-master_强化学习_

强化学习介绍 Reinforcement Learning: An Introduction

CS-7641-Machine-Learning-Notes:在该存储库中，我将发布有关GaTech机器学习课程CS7641的注释

层次分析matlab代码-Notes:笔记

Benchmark模型matlab代码-Notes-1:笔记-1

注：学习更多有关机器学习和人工智能的资源

ResearchPaperNotes:主动阅读研究论文

什么是 DQN (Reinforcement Learning 强化学习)

强化学习：介绍 Reinforcement Learning: An Introduction

Deep Reinforcement Learning深度强化学习

Machine Learning Notes(机器学习笔记)

什么是 Actor Critic (Reinforcement Learning 强化学习)

最新资源