没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
548页
这里是 ShowMeAI 持续分享的【开源eBook】系列!内容覆盖机器学习、深度学习、数据科学、数据分析、大数据、Keras、TensorFlow、PyTorch、强化学习、数学基础等各个方向。整理自各平台的原作者公开分享(审核大大请放手) ◉ 简介:这是本书的第二版,旨在为所有相关学科的读者提供一个清晰的、简单的强化学习关键思想&算法的说明。书籍在第一版的基础上,增加了近些年新的研究主题,内容重点放在核心的算法上。 ◉ 目录: 介绍 多臂老虎机 有限马尔可夫决策过程 动态规划 蒙特卡罗方法 时差学习 n-step Bootstrapping 使用表格方法进行规划和学习 带近似的策略预测 带近似的策略控制 带近似的离策略方法 资格痕迹 策略梯度方法 心理学 神经科学 应用与案例研究 前沿
资源推荐
资源详情
资源评论
ii
Adaptive Computation and Machine Learning
Francis Bach, series editor
A complete list of books published in the Adaptive Computation and Machine Learning
series appears at the back of this book.
Reinforcement Learning:
An Introduction
second edition
Richard S. Sutton and Andrew G. Barto
The MIT Press
Cambridge, Massachusetts
London, England
© 2018, 2020 Richard S. Sutton and Andrew G. Barto
All rights reserved. No pa rt of this book may be reproduced in any form by any electronic
or mechanical means (including photocopying, recording, or information storage and retrieval)
without permission in writing from the copyright hol d er. This work is licensed u n d er the
Creative Commons Attribution-NonCommercial-NoDerivs 2.0 Generic License. To view a copy
of this license, visit
http://creativecommons.org/licenses/by-nc-nd/2.0/
or send a letter
to Creative Commons, PO Box 1866, Mountain View, CA 94042, USA.
This book was set in 10/12, CMR by Westchester Publishing Services. Printed and bound in
the United States of America.
Library of Congress Cataloging-in-Publication Da t a
Names: Sutton, Richard S., author. | Barto, Andrew G. , author.
Title: Reinforcement learning : an introduction / Richard S. Sutton and Andrew G. Barto.
Description: Second edition. | Cambridge, MA : The MIT Press, [2018] | Series: Adaptive
computation and machine learning series | Includes bibliographical references and index.
Identifiers: LCCN 2018023826 | ISBN 978026 2 0 3 9 2 4 6 (hardcover : alk. paper)
Subjects: LCSH: Reinforc eme nt learning.
Classification: LCC Q325.6 .R45 2018 | DDC 006.3/1--dc23 LC record available
at https://lccn.loc.gov/2018023826
10 9 8 7 6 5 4 3 2 1
In memory of A. Harry Klopf
剩余547页未读,继续阅读
资源评论
ShowMeAI
- 粉丝: 5707
- 资源: 42
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功