David Silver.rar
这是David Silver的强化学习课程的课件,共10个课件,可以去网站找到对应的视频作为配合对照。主要包括马尔科夫决策过程、动态规划、蒙特卡洛采样算法、动态差分法、策略梯度等。
这是David Silver的强化学习课程的课件,共10个课件,可以去网站找到对应的视频作为配合对照。主要包括马尔科夫决策过程、动态规划、蒙特卡洛采样算法、动态差分法、策略梯度等。
这是常用的一些强化学习的算法的代码,供实验和练习使用。可以作为配合书籍[Reinforcement Learning: An Introduction (2nd Edition)](http://incompleteideas.net/book/bookdraft2018jan1.pdf) 和课程[David Silver's Reinforcement Learning Course](http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html)来学习。每一个文件夹是对应一个或者多个上述书和课程的一章或者多章。代码使用python3,并使用RL的环境OpenAI Gym。 包括内容: - [Introduction to RL problems & OpenAI Gym](Introduction/) - [MDPs and Bellman Equations](MDP/)马尔科夫决策过程和贝尔曼方程 - [Dynamic Programming: Model-Based RL, Policy Iteration and Value Iteration](DP/)动态规划 - [Monte Carlo Model-Free Prediction & Control](MC/) MC蒙特卡洛算法 - [Temporal Difference Model-Free Prediction & Control](TD/)时间差分法 - [Function Approximation](FA/) - [Deep Q Learning](DQN/) (WIP) 深度Q学习 - [Policy Gradient Methods](PolicyGradient/) (WIP)策略梯度方法 - Learning and Planning (WIP) - Exploration and Exploitation (WIP)
vs2008下实现在MFC框架下的多视图分割示例,基于单文档SDI的。视图分为两个左侧显示图像,能显示五种图像格式,右侧是一个对话框视图,仅是对话框视图的简单实现,不过足以说明如何进行试图分割。
仅使用vs自带资源,不用另外的库。使用的是vs2008本身包含的类CImage。在MFC 框架打开五种图片,bmp,jpg。tif,gif,png。本人测试好用,并附带有五种类型的图片可以供测试。
卷积神经网络CNN 用于数字识别 代码,vc++下编写,有用户界面,具体的使用方法可以去国外作者网站上找。从国外网站上下载的
Michael I. Jordan 的图模型简介,共19页,比较少的页数,介绍的比较基本,初入门的可以看看。