下载频道  >  weixin_36699967的资源
  • 《揭秘深度强化学习》彭伟 完整版

    深度强化学习(Deep Reinforcement Learning,DRL)是深度学习算法和强化学习算法的巧妙结合,它是一种新兴的通用人工智能算法技术,也是机器学习的前沿技术,DRL 算法潜力无限,AlphaGo 是目前该算法*成功的使用案例。DRL 算法以马尔科夫决策过程为基础,是在深度学习强大的非线性函数的拟合能力下构成的一种增强算法。深度强化学习算法主要包括基于动态规划(DP)的算法以及基于策略优化的算法,本书的目的就是要把这两种主要的算法(及设计技巧)讲解清楚,使算法研究人员能够熟练地掌握。 《揭秘深度强化学习人工智能机器学习技术丛书》共10 章,首先以AlphaGo 在围棋大战的伟大事迹开始,引起对人工智能发展和现状的介绍,进而介绍深度强化学习的基本知识。然后分别介绍了强化学习(重点介绍蒙特卡洛算法和时序差分算法)和深度学习的基础知识、功能神经网络层、卷积神经网络(CNN)、循环神经网络(RNN),以及深度强化学习的理论基础和当前主流的算法框架。*后介绍了深度强化学习在不同领域的几个应用实例。引例、基础知识和实例相结合,方便读者理解和学习。 《揭秘深度强化学习 人工智能机器学习技术丛书》内容丰富,讲解全面、语言描述通俗易懂,是深度强化学习算法入门的*选择。本书适合计算机专业本科相关学生、人工智能领域的研究人员以及所有对机器学习和人工智能算法感兴趣的人员。 第1章 深度强化学习概览 1.1 什么是深度强化学习? 1.1.1 俯瞰强化学习 1.1.2 来一杯深度学习 1.1.3 Hello,深度强化学习 1.2 深度强化学习的学习策略 1.3 本书的内容概要 参考文献 第2章 强化学习基础 2.1 真相--经典的隐马尔科夫模型(HMM) 2.1.1 HMM引例 2.1.2 模型理解与推导 2.1.3 隐马尔科夫应用举例 2.2 逢考必过—马尔科夫决策过程(MDP) 2.2.1 MDP生活化引例 2.2.2 MDP模型 2.2.3 MDP模型引例 2.2.4 模型理解 2.2.5 探索与利用 2.2.6 值函数和动作值函数 2.2.7 基于动态规划的强化问题求解 2.3 糟糕,考试不给题库—无模型强化学习 2.3.1 蒙特卡洛算法 2.3.2 时序差分算法 2.3.3 异步强化学习算法 2.4 学霸来了--强化学习之模仿学习 2.4.1 模仿学习(Imitation Learning) 2.4.2 逆强化学习 本章总结 参考 第3章 深度学习基础 3.1 深度学习简史 3.1.1 神经网络发展史 3.1.2 深度学习的分类 3.1.3 深度学习的应用 3.1.4 深度学习存在的问题 3.2 深度学习基础概念 3.2.1 深度学习总体感知 3.2.2 神经网络的基本组成 3.2.3 深度学习训练 3.2.4 梯度下降法 3.2.5 反向传播算法(BP) 3.3 数据预处理 3.3.1 主成分分析(PCA) 3.3.2 独立成分分析(ICA) 3.3.3 数据白化处理 3.4 深度学习硬件基础 3.4.1 深度学习硬件基础 3.4.2 GPU简介 3.4.3 CUDA编程 本章总结 参考 第4章 功能神经网络层 4.1 激活函数单元 4.2 池化层Pooling layer 4.3 参数开关Dropout 4.4 批量归一化层(Batch normalization layer) 4.5 全连接层 4.6 卷积神经网络 4.7 全卷积神经网络 4.8 循环(递归)神经网络(RNN) 4.9 深度学习的 本章总结 参考 第5章 卷积神经网络(CNN) 5.1 卷积神经网络 CNN 基础 5.1.1 卷积神经网络的历史 5.1.2 卷积神经网络的核心 5.2 卷积神经网络 CNN 结构 5.2.1 深度卷积神经网络CNN 5.2.2 深度卷积神经网络CNN可视化 5.3 经典卷积神经网络架构分析 5.3.1 一切的开始--LeNet 5.3.2 王者回归--AlexNet 5.3.3 起飞的时候--VGG 5.3.4 致敬经典GoogLeNet 5.3.5 没有最深只有更深--ResNet 5.4 对抗网络 5.4.1 对抗网络(GAN) 5.4.2 WGAN 5.5 RCNN 5.6 CNN的应用实例 本章总结 参考 第6章 循环神经网络(RNN) 6.1 RNN概览 6.2 长期依赖(Long-Term Dependencies)问题 6.3 LSTM 的变体 本章总结 参考 第7章:如何写自己的CNN—C语言实现深度学习 7.1 如何写自己的CMake文件 7.2 如何写自己神经网络 7.2.1 激活函数 7.2.2 池化函数 7.2.3 全连接层 7.3 卷积神经网络 7.3.1 CNN网络的构建 7.3.2 CNN前向传播 7.3.3 CNN的反向传播 7.4 文件解析 本章总结 第8章 深度强化学习 8.1 初识深度强化学习 8.1.1 深度强化学习概览 8.1.2 记忆回放(Memory-Replay)机制 8.1.3 蒙特卡罗搜索树 8.2 深度强化学习(DRL)中的值函数算法 8.2.1 DRL中值函数的作用 8.2.2 DRL中值函数理论推导 8.3 深度强化学习中的策略梯度(Policy Gradient) 8.3.1 策略梯度的作用和优势 8.3.2 策略梯度的理论推导 8.3.3 REINFORCE算法 8.3.4 策略梯度的优化算法 8.3.5 策略子-评判算法(Actor-Critic) 8.4 深度强化学习网络结构 参考 第9章 深度强化学习算法框架 9.1 深度Q学习 9.2 双Q学习 9.3 异步深度强化学习 9.4 异步优越性策略子-评价算法 9.5 DDPG 算法: 9.6 值迭代网络 本章总结 参考 第10章 深度强化学习应用实例 10.1 Flappy Bird 应用 10.2 Play Pong 应用 10.3 深度地形-自适应应用(Deep Terrain-adaptive应用) 10.4 AlphaGo 254 10.4.1 独立算法的研究部分 10.4.2 AlphaGo算法 本章总结 参考 附录: 常用的深度学习框架 F.1. 谷歌TensorFlow F.1.1 TensorFlow 简介 F.1.2 TensorFlow 基础 F.2 轻量级MXNet F.2.1 MXnet介绍 F.2.2 MXnet基础 F.3 来至UCLA 的Caffe F.3.1 Caffe 简介 F3.2 Caffe基础 F.4 悠久的 Theano F.4.1 Theano简介 F.4.2 Theano基础 F.5 30s 入门的Keras 参考

    2019-04-13
    47
  • 自然语言处理实战聊天机器人技术原理与应用

    聊天机器人作为人工智能技术的杀手级应用,发展得如火如荼,各种智能硬件层出不穷。《自然语言处理实践:聊天机器人技术原理与应用》系统地阐述了聊天机器人的分类和关键技术,不仅给出了实际案例,还展望了聊天机器人在通往更智能化、更人性化、更趣味化的道路上所面临的挑战。同时,针对聊天机器人在从感知智能到认知智能的跨越中所面临的难题,《自然语言处理实践:聊天机器人技术原理与应用》着重讨论了知识图谱和深度学习技术在自然语言处理、问答、推理、服务融合等方面的应用。 《自然语言处理实践:聊天机器人技术原理与应用》适合有志于从事人工智能行业,以及想了解聊天机器人到底是什么的读者阅读。1 聊天机器人概述 1 1.1 聊天机器人的发展历史 1 1.2 聊天机器人的分类与应用场景 6 1.3 聊天机器人生态介绍 9 1.3.1 典型聊天机器人框架介绍 11 1.3.2 聊天机器人平台介绍 13 1.3.3 典型的聊天机器人产品介绍 13 1.4 参考文献 19 2 聊天机器人技术原理 20 2.1 自然语言理解 21 2.1.1 自然语言理解概览 23 2.1.2 自然语言理解基本技术 26 2.1.3 自然语言表示和基于深度学习的自然语言理解 36 2.1.4 基于知识图谱的自然语言理解 46 2.2 自然语言生成 56 2.2.1 自然语言生成综述 56 2.2.2 基于检索的自然语言生成 58 2.2.3 基于模板的自然语言生成 59 2.2.4 基于深度学习的自然语言生成 60 2.3 对话管理 61 2.4 参考文献 65 3 问答系统 67 3.1 问答系统概述 67 3.2 KBQA 系统 71 3.2.1 KBQA 系统简介 71 3.2.2 主流的KBQA 方法 79 3.3 KBQA 系统实现 96 3.3.1 系统简介 96 3.3.2 模块设计 97 3.4 参考文献 105 4 对话系统 109 4.1 对话系统概述 109 4.2 对话系统技术原理 113 4.2.1 NLU 模块 115 4.2.2 DST 模块 120 4.2.3 DPL 模块 121 4.2.4 NLG 模块 126 4.3 基于聊天机器人平台搭建对话系统 126 4.3.1 NLU 模块实现 129 4.3.2 DST 与DPL 模块实现 130 4.3.3 NLG 模块实现 131 4.4 面向任务的对话系统实现 132 4.5 参考文献 137 5 闲聊系统 139 5.1 闲聊系统概述 139 5.2 基于对话库检索的闲聊系统 140 5.2.1 基于对话库检索的闲聊系统介绍 140 5.2.2 对话库的建立 143 5.2.3 基于检索的闲聊系统实现 145 5.3 基于生成的闲聊系统 150 5.3.1 基于生成的闲聊系统介绍 150 5.3.2 生成式闲聊系统的新发展 152 5.3.3 基于生成的闲聊系统实现 155 5.4 参考文献 157 6 聊天机器人系统评测 159 6.1 问答系统评测 159 6.1.1 问答系统评测会议 160 6.1.2 问答系统评测数据集 171 6.1.3 问答系统评测标准 173 6.2 对话系统评测 174 6.2.1 对话系统评测会议 176 6.2.2 对话系统评测数据集 177 6.2.3 对话系统评测标准 178 6.3 闲聊系统评测 179 6.3.1 闲聊系统评测介绍 179 6.3.2 闲聊系统评测标准 180 6.4 参考文献 183 7 聊天机器人挑战与展望 185 7.1 开放式挑战 185 7.2 技术与应用展望 187 7.3 从聊天机器人到虚拟生命 190 7.4 参考文献 193

    2019-04-08
    50
  • HTML5+CSS3实现室内布局源码

    HTML5+CSS3实现室内布局源码HTML5+CSS3实现室内布局源码HTML5+CSS3实现室内布局源码

    2018-05-06
    34
  • Prototype 实现的局部放大图像带播放的Lightbox插件

    Prototype 实现的局部放大图像带播放的Lightbox插件Prototype 实现的局部放大图像带播放的Lightbox插件Prototype 实现的局部放大图像带播放的Lightbox插件

    2018-05-06
    50
  • HTML5+CSS3实现3d室内布局源码

    HTML5+CSS3实现3d室内布局源码HTML5+CSS3实现3d室内布局源码HTML5+CSS3实现3d室内布局源码HTML5+CSS3实现3d室内布局源码

    2018-05-06
    46
  • HTML5+CSS3实现3d立方体源码

    HTML5_CSS3实现3d立方体HTML5_CSS3实现3d立方体HTML5_CSS3实现3d立方体HTML5_CSS3实现3d立方体HTML5_CSS3实现3d立方体

    2018-05-06
    50
  • jQuery+CSS3实现的图片分割特效源码

    jQuery+CSS3实现的图片分割特效源码jQuery+CSS3实现的图片分割特效源码jQuery+CSS3实现的图片分割特效源码jQuery+CSS3实现的图片分割特效源码

    2018-05-06
    10
  • HTML5+JS实现的全屏星空特效源码

    HTML5+JS实现的全屏星空特效源码HTML5+JS实现的全屏星空特效源码HTML5+JS实现的全屏星空特效源码HTML5+JS实现的全屏星空特效源码HTML5+JS实现的全屏星空特效源码

    2018-05-06
    44
  • HTML5 canvas鼠标点击的粒子云特效

    给大家的一些建议:1.早做职业规划 2.多做项目多实习 3.多积累面试经验 4.培养团队合作意识

    2018-05-06
    16
  • 吴恩达-深度学习-Deeplearning-课程中文版笔记

    Coursera深度学习教程中文笔记 课程概述 这些课程专为已有一定基础(基本的编程知识,熟悉Python、对机器学习有基本了解),想要尝试进入人工智能领域的计算机专业人士准备。介绍显示:“深度学习是科技业最热门的技能之一,本课程将帮你掌握深度学习。” 在这5堂课中,学生将可以学习到深度学习的基础,学会构建神经网络,并用在包括吴恩达本人在内的多位业界顶尖专家指导下创建自己的机器学习项目。Deep Learning Specialization对卷积神经网络 (CNN)、递归神经网络 (RNN)、长短期记忆 (LSTM) 等深度学习常用的网络结构、工具和知识都有涉及。 课程中也会有很多实操项目,帮助学生更好地应用自己学到的深度学习技术,解决真实世界问题。这些项目将涵盖医疗、自动驾驶、和自然语言处理等时髦领域,以及音乐生成等等。Coursera上有一些特定方向和知识的资料,但一直没有比较全面、深入浅出的深度学习课程——《深度学习专业》的推出补上了这一空缺。 课程的语言是Python,使用的框架是Google开源的TensorFlow。最吸引人之处在于,课程导师就是吴恩达本人,两名助教均来自斯坦福计算机系。完成课程所需时间根据不同的学习进度,大约需要3-4个月左右。学生结课后,Coursera将授予他们Deep Learning Specialization结业证书。 “我们将帮助你掌握深度学习,理解如何应用深度学习,在人工智能业界开启你的职业生涯。”吴恩达在课程页面中提到。

    2018-05-04
    45