没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
深度学习
强化学习DQN
强化学习DQN
强化学习
深度学习
1星
需积分: 39
50 下载量
96 浏览量
2018-05-25
14:53:15
上传
评论
收藏
1.51MB
PDF
举报
温馨提示
立即下载
这本书详细介绍了强化学习的常用算法以及算法原理,从蒙特卡罗方法到Q_learning最终到DQN
资源推荐
资源评论
深度强化学习DQN(DeepQNetwork)原理及例子:如何解决迷宫问题,附源码 深度学习原理.pdf
浏览:123
5星 · 资源好评率100%
深度强化学习DQN(DeepQNetwork)原理及例子:如何解决迷宫问题,附源码 深度学习原理.pdf
基于深度强化学习DQN的无人艇避障控制(matlab)
浏览:173
5星 · 资源好评率100%
基于深度强化学习DQN的无人艇避障控制(matlab)无人艇建模,巡逻艇建模,以及DQN代码,详见 https://blog.csdn.net/weixin_39344871/article/details/119346316
dqn走迷宫matlab-深度强化学习DQN(DeepQNetwork)原理及例子:如何解。。。 深度学习原理.pdf
浏览:2
5星 · 资源好评率100%
dqn走迷宫matlab-深度强化学习DQN(DeepQNetwork)原理及例子:如何解。。。 深度学习原理.pdf
DQN最短路径算法,MATLAB实现,含界面,可运行!
浏览:57
5星 · 资源好评率100%
DQN找最短路径算法,MATLAB实现,含界面,可运行!
强化学习算法-基于python的深度强化学习dqn算法实现
浏览:201
5星 · 资源好评率100%
强化学习算法-基于python的深度强化学习dqn算法实现
用matlab自主搭建DQN算法解决CartPole问题
浏览:69
5星 · 资源好评率100%
本项目采用MATLAB语言搭建cartPole问题环境以及手动实现DQN算法能够很好的解决控制小车的平衡一类问题,其目的是帮助初学者很好地理解DQN算法。
用MATLAB语言解决DQN最短路径问题
浏览:73
5星 · 资源好评率100%
不用强化学习工具箱的DQN算法案例与matlab代码,方便大家学习使用。可以在此基础上直接更改编写自己的项目
DQN实现的两种版本
浏览:89
关于DQN的两种版本(使用stop_gradient与不使用stop_gradient) 对不起.....我不知道怎么将文件放到CSDN博客中下载,所以只能放这边了,没有资源分为0的选项.....
强化学习matlab代码
浏览:131
3星 · 编辑精心推荐
关于迷宫类的强化学习(Q-learning)matlab完整代码
强化学习matlab源代码
浏览:130
强化学习matlab源代码很少见的源代码,详细介绍Q学习的编程过程。
莫烦老师 走迷宫 智能强化学习DQN算法实现,开箱即用
浏览:162
https://mofanpy.com/tutorials/machine-learning/reinforcement-learning/intro-DQN/
deep-reinforcement-learning-atari-pong:强化学习DQN算法的PyTorch在OpenAI Atari Pong游戏中的应用
浏览:51
Atari Pong中的深度强化学习算法 概括 此应用程序的目标是找出深度Q学习(DQN)在OpenAI环境中对Pong的Atari 1600游戏有多准确和有效。 在DQN之上,测试了对相同算法的其他改进,包括多步DQN,Double DQN和Dueling DQN。 从下图可以看出,基本DQN仅需玩约110场游戏即可达到类似于人的准确性,而经过300场游戏即可达到极高的准确性。 此项目中考虑的D
强化学习资料
浏览:188
强化学习是机器学习领域的重要研究方向,本资料包括史忠植老师的强化学习PPT和国外RL教材。
深度强化学习 DQN系列论文
浏览:78
5星 · 资源好评率100%
深度强化学习系列论文,包括最基础的DQN,DQN模型改进,DQN算法改进,分层DRL,基于策略梯度的深度强化学习等等,论文基本源自顶会
深度强化学习
浏览:107
除了使徒直接去简历一个可以模拟承认大脑的程序之外,为什么不是图简历一个可以模拟小孩大脑的程序呢?如果他接受适当的教育,就会获得成人的大脑。
深度强化学习 ( DQN )基本原理与AI项目实战 教学视频 代码资料
浏览:77
强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。 在强化学习的世界里, 算法称之为Agent, 它与环境发生交互,Agent从环境中获取状态(state),并决定自己要做出的动作(action).环境会根据自身的逻辑给Agent予以
DQN学习flppyBird
浏览:109
基于TensorFlow的DQN学习FlppyBird代码,可以学习一下,想免费,但是免费不了
matlab神经网络43个案例(源代码)
浏览:131
短期学习,即可应用于数据处理,模型建立。在文章发表过程中发挥重要作用
深度强化学习.rar
浏览:46
深度强化学习课程的高清课间资源,对于学习深度学习以及强化学习理论的研究人士很有帮助
基于python的深度强化学习DQN控制cartpole设计与实现
浏览:43
基于python的深度强化学习DQN控制cartpole设计与实现
DQN机器学习
浏览:80
通过DQN的模型,实现机器学习,并且进行统计。练手的DEMO。
深度强化学习DQN算法源码【Pytorch实现·超详细注释】
浏览:199
5星 · 资源好评率100%
基于Pytorch实现的深度强化学习DQN算法源代码,具有超详细的注释,已经在诸多项目中得到了实际应用。主要包含2个文件:(1)dqn.py,实现DQN只能体的结构、经验重放池、Q神经网络、学习方法等;(2)runner.py,使用dqn.py中的智能体与环境进行交互与学习,并最终学会仿真月球车着陆游戏。
强化学习(TD算法)
浏览:171
5星 · 资源好评率100%
强化学习的任务就是利用观察到的回报来学习针对某个环境的最优或接近最优策略。它作为一种无导师机器学习方法,把环境的反馈作为 输入、通过学习选择能达到其目标的最优动作
一种新的多智能体强化学习算法及其在多机器人协作任务中的应用
浏览:24
在多机器人系统中,评价一个机器人行为的好坏常常依赖于其它机器人的行为,此时必须采用组合动 作以实现多机器人的协作,但采用组合动作的强化学习算法由于学习空间异常庞大而收敛得极慢.本文提出的新方 法通过预测各机器人执行动作的概率来降低学习空间的维数,并应用于多机器人协作任务之中.实验结果表明,基 于预测的加速强化学习算法可以比原始算法更快地获得多机器人的协作策略.
Matlab深度学习工具箱
浏览:84
压缩文件包含三个常用的Matlab深度学习工具箱 分别是DeeplearningToolbox,libsvm,matconvnet 使用时直接添加到MATLAB的Toolbox路径下即可 工具箱里都有一些example 可以在这些例子的基础上写一个自己的神经网络结构
构建一个简单的卷积神经网络,使用DRL框架tianshou匹配DQN算法
浏览:177
在之前的文章中,我们做了如下工作: 如何设计一个类flappy-bird小游戏:【python实战】使用pygame写一个flappy-bird类小游戏 | 设计思路+项目结构+代码详解|新手向 DFS 算法是怎么回事,我是怎么应用于该小游戏的:【深度优先搜索】一个实例+两张动图彻底理解DFS|DFS与BFS的区别|用DFS自动控制我们的小游戏 BFS 算法是怎么回事,我是怎么应用于该小游戏的:【
dqn_DQN算法_DQN_DQN实现_
浏览:187
5星 · 资源好评率100%
dqn算法,深度Qlearning算法 实现,普通实现,基本完成RL任务
python版flappybird源码
浏览:159
5星 · 资源好评率100%
使用了pygame和gameobject实现的python版的flappybird小游戏
强化学习算法(Csaba Szepesvari)Algorithms for Reinforcement Learning (Csaba Szepesvari)
浏览:103
本书重点研究基于强大的动态编程理论的强化学习算法。 它给出了学习问题的相当全面的目录,描述了核心思想,注意到了大量最新的算法,然后讨论了它们的理论特性和局限性。
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
stephenye82
2018-05-25
不是书,不值得下载,这也好意思要5分?,需要看的可以看:http://wwwbuild.net/almosthuman2014/319097.html?from=account 一模一样的。
wshzd
粉丝: 1437
资源:
4
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
使用贪心算法解决会议时间安排问题的 Java 示例代码
贪心算法解决活动选择问题,Java版源码
贪心算法解决活动选择问题源码
4_base.apk.1
杨辉三角源码,java文件
tomcat服务器软件
PDF转PPT工具,实现批量将文件夹下的PDF转化为PPT
如何使用 Gitea 搭建图床
打印杨辉三角 Java程序源码
jizu3.cod
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功