没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
548页
《强化学习(第2版)》英文版,作为强化学习思想的深度解剖之作,被业内公认为是一本强化学习基础理论的经典著作。它从强化学习的基本思想出发,深入浅出又严谨细致地介绍了马尔可夫决策过程、蒙特卡洛方法、时序差分方法、同轨离轨策略等强化学习的基本概念和方法,并以大量的实例帮助读者理解强化学习的问题建模过程以及核心的算法细节。
资源推荐
资源详情
资源评论
ii
Adaptive Computation and Machine Learning
Francis Bach
A complete list of books published in the Adaptive Computation and Machine Learning
series appears at the back of this book.
The cover desi gn is based on th e tr ajectories of a simulated bicycle controlled by a
reinforcement learning system developed by Jette Randløv.
Reinforcement Learning:
An Introduction
second edition
Richard S. Sutton and Andrew G. Barto
The MIT Press
Cambridge, Massachusetts
London, England
c
2018 Richard S. Sutton and Andrew G. Barto
This work is licensed under the Creative Commons Attribution-NonCommercial-NoDerivs
2.0 Generic License. To view a copy of this license, v i si t
http://creativecommons.
org/licenses/by-nc-nd/2.0/
or send a letter to Creative Commons, PO Box 1866,
Mountain View, CA 94042, USA.
This book was set in 10/12, CMR by Westchester Publishing Services. Printed and bound
in the United States of America.
Library of Congress Cataloging-in-Publication Data
Names: Sutton, Richard S., author. | Barto, Andrew G., author.
Title: Reinforcement learning: an introduction / Ri chard S. Sutton and Andrew G. Bart o.
Description: Second edition.
|
Cambridge, MA : The MIT Press, [2018]
|
Series: Adaptive
computation and machine learning series
|
Includes bibliographical r efer en ce s and index.
Identifiers: LCCN 2018023826 | ISBN 9780262039246 (hardcover : alk. paper)
Subject s: LCSH: Reinforcement learning
Classification: LCC Q325.6 .R45 2018 | DDC 006.3/1--dc23 LC record available
at https://lccn.loc.gov/2018023826
10 9 8 7 6 5 4 3 2 1
In memory of A. Harry Klopf
剩余547页未读,继续阅读
资源评论
zshzh2015
- 粉丝: 11
- 资源: 40
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- HM2305B-VB一款P-Channel沟道SOT23的MOSFET晶体管参数介绍与应用说明
- 基于52单片机、ADC0832、LCD1602、两个74HC393和一个74HC08的频率测量计 不能用,请私我
- HM2302-VB一款N-Channel沟道SOT23的MOSFET晶体管参数介绍与应用说明
- python实战项目-学生成绩管理系统(基础版)
- 微信小程序源码 实现查公交 滴滴公交 app 源码下载
- HM2302E-VB一款N-Channel沟道SOT23的MOSFET晶体管参数介绍与应用说明
- 基于C#图片相似度比较,感知哈希算法
- VR开发的概要介绍与分析
- 自动驾驶定位系列教程七:点云畸变补偿.pdf
- HM2302D-VB一款N-Channel沟道SOT23的MOSFET晶体管参数介绍与应用说明
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功