没有合适的资源?快使用搜索试试~
我知道了~
文库首页
课程资源
讲义
Reinforcement Learning-An Introduction by Sutton R S,Barto A G
Reinforcement Learning-An Introduction by Sutton R S,Barto A G
强化学习算法
5星
· 超过95%的资源
需积分: 14
26 下载量
140 浏览量
2018-04-07
08:46:53
上传
评论
1
收藏
5.45MB
PDF
举报
温馨提示
立即下载
强化学习算法的入门资料,有利于大家学习强化学习算法
资源推荐
资源评论
Reinforcement Learning: An Introduction
浏览:31
5星 · 资源好评率100%
The authoritative textbook for reinforcement learning by Richard Sutton and Andrew Barto. Contents Preface Series Forward Summary of Notation I. The Problem 1. Introduction 1.1 Reinforcement Learnin
增强学习导论(Reinforcement Learning An Introduction_Sutton)
浏览:125
本书作者是Richard S. Sutton,是增强学习领域的开山之作,虽然这本书不算太新,单它奠定了RL的基本理论框架,所以将它作为入门级的著作是十分有用的。
Reinforcement Learning: An Introduction,Richard S. Sutton and Andrew G. Barto
浏览:131
Reinforcement Learning: An Introduction,Second edition, in progress,Richard S. Sutton and Andrew G. Barto
sutton,Barto强化学习经典教材
浏览:135
Richard S. Sutton, Andrew G. Barto-Reinforcement Learning_ An Introduction-MIT Press (1998)高清版经典教材
David Silver强化学习 第一课PPT
浏览:37
David Silver强化学习 第一课PPT,共10节课。
Reinforcement Learning - An Introduction (原版,非HTML打印)
浏览:50
5星 · 资源好评率100%
Reinforcement Learning - An Introduction (原版,非HTML打印)
rl-tictactoe:井字脚的增强学习剂。 实现萨顿和巴托(Sutton and Barto)第1章中的示例
浏览:47
井字游戏中的强化学习 Tic-Tac-Toe值功能学习代理的参考实现,在Sutton和Barto的“强化学习:简介”的第1章中进行了介绍。 该代理包含一个查找表,该表将状态映射到值,其中初始值是1表示获胜,0表示平局或亏损,否则为0.5。 代理商每走一步,要么选择最大值移动(贪婪),要么选择几率ε,随机选择(探索性)。 默认情况下epsilon = 0.1。 每次贪婪移动后,代理都会根据以下等式更
einforcement learning An Introduction 第二版
浏览:178
完整版,并且清晰度很好的一本书,高清版本,强化学习必备
Reinforcement Learning - An introduction
浏览:198
Reinforcement Learning - An introduction The best book for reinforcement learning
Reinforcement Learning - An Introduction
浏览:155
5星 · 资源好评率100%
Richard S. Sutton, Andrew G. Barto
Reinforcement Learning - An Introduction 2nd 2017 6月版
浏览:94
4星 · 用户满意度95%
Reinforcement Learning: An Introduction Richard S. Sutton and Andrew G. Barto Second Edition, in progress MIT Press, Cambridge, MA, 2017
Reinforcement Learning: An Introduction (2nd Edition)
浏览:124
Richard Sutton’s & Andrew Barto’s Reinforcement Learning: An Introduction (2nd Edition) book.
Reinforcement Learning:An Introduction.pdf
浏览:86
Reinforcement Learning: An Introduction Second edition, in progress November 5, 2017 Richard S. Sutton and Andrew G. Barto The text is now complete, except possibly for one more case study to be ...
强化学习介绍 Reinforcement Learning: An Introduction
浏览:26
Reinforcement Learning: An Introduction Richard S. Sutton and Andrew G. Barto
Python Implementation of Reinforcement Learning: An Introduction Code
浏览:19
Python code for Sutton & Barto's book Reinforcement Learning: An Introduction (2nd Edition)
Reinforcement Learning: An Introduction 2018年 第二版和之前2015中文翻译版
浏览:150
5星 · 资源好评率100%
强化学习导论2018年第二版,作者:Richard S. Sutton and Andrew G. Barto,是强化学习方面最权威的学者,以及2015年中文翻译版
Reinforcement Learning An Introduction(2nd)2018.pdf
浏览:168
Reinforcement Learning: An Introduction Small book cover Richard S. Sutton and Andrew G. Barto Second Edition (see here for the first edition) MIT Press, Cambridge, MA, 2018
Reinforcement Learning An Introduction
浏览:160
Reinforcement Learning An Introduction 第二版,Richard S. Sutton and Andrew G. Barto等著,548页,非扫描版
Reinforcement Learning: An Introduction(最新版书籍+代码,February 28, 2018)
浏览:70
Reinforcement Learning: An Introduction (****Complete Draft****) Second edition, in progress Richard S. Sutton and Andrew G. Barto 2014, 2015, 2016, 2017, 2018 2018年最新版本,应该是终版草稿了吧,...
An Introduction to Reinforcement Learning
浏览:53
Sutton 的 An Introduction to Reinforcement Learning. 基础教程。
Vector Davinci官方帮助配置使用手册(AutoSAR).pdf
浏览:90
5星 · 资源好评率100%
Vector官方帮助文档,配置使用手册。从新建DaVinci工程开始一步一步的讲解如何配置工程;如何编译生成C代码;如何导入CDD、DBC等文件。手册讲解细致,可以说是手把手教学了
c++入门,核心,提高讲义笔记
浏览:31
5星 · 资源好评率100%
最详细的c++入门,核心,提高讲义笔记,看会成为大佬没问题,下载后有疑问请私信。
离散数学及其应用 第八版 奇数编号练习答案.pdf
浏览:76
4星 · 用户满意度95%
离散数学及其应用 第八版本科教学版答案,有需要其他版本到的还可以去华章图书官网下载 地址:http://www.hzbook.com/
数字图像处理 冈萨雷斯 课后习题
浏览:137
数字图像处理 冈萨雷斯 第三版 课后习题。 免费下,没积分的朋友们,免费下。 百度文库网页链接转出来的,清晰,内容可能不太全,没积分的朋友们将就看吧。
科研伦理与学术规范 期末考试2 (40题).pdf
浏览:167
科研伦理与学术规范 期末考试2 (40题)
最值得收藏的 考研线性代数 全部知识点思维导图整理(张宇, 汤家凤), 附带惯用思维/做题技巧/易错点整理.emmx
浏览:173
5星 · 资源好评率100%
用mindmaster打开文件,本文的思维导图根据张宇和汤家凤两人的课程整理而来并标记出重点内容,整合了很多技巧,题型,方法
软件著作权设计说明书模板(含填写说明).docx
浏览:166
5星 · 资源好评率100%
软件著作权最新版设计说明书,每项都有填写说明,可供新人参考。
AUTOSAR培训教材.rar
浏览:115
3星 · 编辑精心推荐
AUTOSAR培训教材,共25.7M,17个PDF文件,十分详细,适合自学或者培训使用。 主要内容:00_AUTOSAR基础知识介绍、01_SWC应用层组件设计详解、02_OS操作系统详解、03_Communication Stack详解、04_Diagnosis Stack 详解、05_Mem Stack详解、06_IO Stack详解、07_WdgM Stack 详解、08_EcuM BswM
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
工业人工智能
2019-08-08
不错的东西。
Ernestzeng
粉丝: 1
资源:
6
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
数据可视化-大数据实时监测及统计分析大屏页面.zip
从sqlserver到mysql数据导出后导入脚本(实测,实用)
docker镜像demo flask demo
Python基于预训练大模型BERT微调完成的词语切分中文分词任务源代码+数据集
学生奖学金随机分组发放.zip
vue2插件之@lucky-canvas/vue,大转盘、抽奖、老虎机
Python基于预训练大模型ernie微调完成的阅读理解任务源代码+数据集
yolo,unet在C#上的部署
libjpeg 编译所需的 Win32.mak vs编译libjpeg
自动驾驶-状态估计和定位-粒子滤波实现和源码.pdf
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功