没有合适的资源?快使用搜索试试~
我知道了~
文库首页
人工智能
机器学习
CS294 强化学习视频课程
CS294 强化学习视频课程
CS294
强化学习
需积分: 13
15 下载量
162 浏览量
2019-03-27
10:02:00
上传
评论
1
收藏
116B
TXT
举报
温馨提示
立即下载
斯坦福大学CS294课程视频,课程作业等等资料。关于强化学习的。网盘链接欢迎下载。
资源推荐
资源评论
CS294深度强化学习课件(完整版)
浏览:15
CS294深度强化学习课件(完整版)CS294深度强化学习课件(完整版)
CS294-112 Deep Reinforcement Learning Sp17强化学习课件
浏览:176
CS294-112 Deep Reinforcement Learning Sp17 强化学习
深度强化学习视频.zip
浏览:146
模仿学习,深度强化学习领域视频合集
深度强化学习 ( DQN )基本原理与AI项目实战 教学视频 代码资料
浏览:120
强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。 在强化学习的世界里, 算法称之为Agent, 它与环境发生交互,Agent从环境中获取状态(state),并决定自己要做出的动作(action).环境会根据自身的逻辑给Agent予以
David Silver的强化学习视频的相关ppt
浏览:76
主要是David Silver的强化学习视频的相关ppt,可以配合视频一块看
deepmind 2018 深度学习与强化学习进阶中英文字幕视频
浏览:175
deepmind 2018 深度学习与强化学习进阶中英文字幕视频 16个视频大约25g的百度云资源
CS294_homework:我对伯克利的CS294(深度强化学习)家庭作业的解决方案
浏览:97
CS 294-112作业(2017年秋季提供) 这是我为做作业的github(于2017年秋季提供)。 我远程讲授了这门课程(使用讲义和视频),并实施了作业的编码部分。 以下是我为每个作业分配的内容简介。 免责声明:此代码仅用于教育目的。 参加本课程当前迭代的学生应避免复制此代码,因为这会破坏学术诚信并妨碍他们自己的教育。 依存关系 Gym 0.9.5用于作业3。 请注意,在本课程中,其
强化学习 David Silver课程集合
浏览:57
强化学习 David Silver课程集合强化学习 David Silver课程集合
UCB CS294 深度强化学习中文笔记(谢天)
浏览:114
5星 · 资源好评率100%
UCB CS294 深度强化学习中文笔记(谢天) UCB CS294 深度强化学习中文笔记(谢天)
斯坦福大学CS229机器学习2018年秋季:斯坦福大学CS229机器学习课程
浏览:94
它概述了有监督,无监督和强化学习的技术,以及计算学习理论的一些结果。 我将完成在线版本并在此存储库中完成CS229 2018 Fall的问题集。课程资源 CS229讲义:| 。 CS229讲座视频: |。 CS229问题集: CS229的简化...
deep-reinforcement-learning:加州大学伯克利分校CS 294的编程作业和讲座
浏览:90
本课程将假设您对强化学习,数值优化和机器学习有所了解。 该课程涵盖以下主题:有监督的学习和决策; 基本强化学习:Q学习和策略梯度; 高级模型学习和预测; 高级深度强化学习:信任区域政策梯度,行为者批评方法...
CS420
浏览:128
本课程提供机器学习的入门基础讲解,让学生能够全面了解机器学习这门学科的类别问题和方法论,包括监督学习\无监督学习(涵盖绝大部分预测类应用,例如推荐系统,图像识别,网页排序等等)和强化学习(包括所有决策...
exploring-reinforcement-learning:孟买IIT的人工智能和机器学习课程项目(CS337),2019年秋季。 对两个经典Atari游戏Breakout和Pong的不同强化学习算法进行了比较分析
浏览:187
突围和乒乓球强化学习AIIT的课程项目(CS-337),2019年秋季,孟买IIT。 该项目探索以下强化学习算法,并对游戏Breakout和Pong进行比较分析: 深度Q学习优势演员批判性学习近端政策优化信任区域政策优化请访问和培训...
D.Silver.rar
浏览:82
David Silver 大神是 AlphaGo 的最主要研发人员,师从强化学习之父Richard Sutton,公开课讲解的内容十分生动,结合课程课件配合视频学习效率更高。课程如下: Part I: Elementary Reinforcement Learning 1 ...
matlab代码做游戏-CS-recourses:CS资源
浏览:88
强化学习 () () 先进的机器学习 () () () 基于ML的自然语言处理和计算机视觉 () () () () 时间序列分析 杂项机器学习主题 () () () 计算机网络 () ()() () () () 计算机科学家...
Matlab程序代码大作业-School_Projects:匹兹堡大学2016-2017学年各种课程的作业汇总
浏览:99
本入门级机器学习课程概述了现代机器学习中使用的许多模型和算法,包括线性模型,多层神经网络,支持向量机,密度估计方法,贝叶斯信念网络,聚类,集成方法和强化学习。 本课程介绍了这些方法的基本思想和直觉,...
人工智能属于什么专业.docx
浏览:74
专业基础课 自动规划、概率图模型、强化学习、神经网络、深度学习... 这样一门"引领未来"的学科,却面临着较大的人才缺口。据计算,我国当前人工智能领域还缺30万人才,这或许是高校争相开设该专业的原因之一。 人工...
ChatGPT教程(终极版)最全整理
浏览:19
5星 · 资源好评率100%
这是一篇动了某些人利益的良心教程。 这是一篇姗姗来迟的ChatGPT教程。 纯小白关于ChatGPT入门,你看我这篇文章就够了。 如果你已经用上了ChatGPT,更要恭喜你挖到宝藏,后面的高级技巧一定能让你有收获。 文章包含以下内容: 一、ChatGPT是啥?有什么用; 二、ChatGPT如何注册; 三、ChatGPT使用方法; 四、用ChatGPT搞钱; 五、高级技巧;
博客中Kmeans以及FCM算法数据(免积分)
浏览:124
5星 · 资源好评率100%
博客中Kmeans以及FCM算法的数据,包括IRIS鸢尾花数据集、Wine葡萄酒数据集、Seed小麦种子数据集、glass数据集、WDBD乳腺癌数据集,下载在直接存入项目文件夹即可,如果下载不了,可以私信我,看到后会及时回复。
hugging face的models-openai-clip-vit-large-patch14文件夹
浏览:103
3星 · 编辑精心推荐
用于无法访问hugging face并需要运行stable-diffusion-webui时使用
神经网络回归预测--气温数据集
浏览:28
5星 · 资源好评率100%
神经网络回归预测--气温数据集
XGBoost+LightGBM+LSTM-光伏发电量预测
浏览:92
5星 · 资源好评率100%
包含比赛代码、数据、训练后的神经网络模型等。 在分析光伏发电原理的基础上,论证了辐照度、光伏板工作温度等影响光伏输出功率的因素,通过实时监测的光伏板运行状态参数和气象参数建立预测模型,预估光伏电站瞬时发电量,根据光伏电站DCS系统提供的实际发电量数据进行对比分析,验证模型的实际应用价值。 1 数据探索与数据预处理 1.1 赛题回顾 1.2 数据探索性分析与异常值处理 1.3 相关性分析 2 特
Mathwork+Matlab+编程手册
浏览:37
Introduction to Programming with MATLAB ~ Vanderbilt University
Stable-Diffusion WEBUI 简体中文语言包(2023.05.30更新)
浏览:83
AI绘图,Stable-Diffusion WEBUI,本地化(简体中文)语言文件。 原始文件来自翻译插件,根据自己实际使用情况,增加和修改了一些翻译。 配合【双语插件】看上去要自然一点,内容还在继续完善中。 本次增加了一些翻译内容,特别是插件。 同时继续合并了其它翻译插件的内容。 最近文字提示修改得有点多啊。 请放入“你的SDWebUI项目位置/localizations/”中。 中文翻译
基于Python+pytorch的图像处理+附完整代码图像处理,能够轻松实现图像的读取、显示、裁剪等还有机器学习等操作
浏览:138
Python+PyTorch:图像处理界的“瑞士军刀” 在图像处理这个充满魔法的世界里,Python和PyTorch这对黄金搭档,就像一位技艺高超的魔法师和一把无所不能的“瑞士军刀”,总能轻松解决各种看似棘手的难题。它们以高效、灵活和强大的特性,引领着图像处理技术的发展潮流,让无数开发者为之倾倒。Python,这位优雅的魔法师,以其简洁易懂的语法和丰富的库资源,赢得了广大开发者喜爱。无论是数据处理
时间序列预测模型实战案例(Xgboost)(Python)(机器学习)包括时间序列预测和时间序列分类,点击即可运行!
浏览:106
内容概要 资源包括三部分(时间序列预测部分和时间序列分类部分和所需的测试数据集全部包含在内) 在本次实战案例中,我们将使用Xgboost算法进行时间序列预测。Xgboost是一种强大的梯度提升树算法,适用于各种机器学习任务,它最初主要用于解决分类问题,在此基础上也可以应用于时间序列预测。 时间序列预测是通过分析过去的数据模式来预测未来的数值趋势。它在许多领域中都有广泛的应用,包括金融、天气预报、股
中文短信数据集-带标签
浏览:25
本数据集可用于进行文本分类、信息检索等自然语言处理实验,共包含80万条短信。其中:原始数据集data.txt每行为1条短信,格式为“标签\t短信内容”,标签=0表示正常短信,标签=1表示垃圾短信。train.csv和test.csv为拆分后的训练集与测试集,拆分代码为train_test_split.py。stopwords.txt为使用的停用词。 基于该数据集的文本分类详见文章https://
亚博K210模型训练部署
浏览:69
亚博K210模型训练部署
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
KAila_Lucky
粉丝: 4
资源:
3
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
炫酷代码雨,超级炫酷哦!!!
基于物联网MQTT协议的智能停车场管理系统
基于深度学习的行人检测系统源码+项目说明(YoloV3+Tensorflow).zip
区块链系统:以比特币为基础
直接插入排序(Insertion Sort)是一种简单直观的排序算法.txt
Python实现基于深度学习的预测区域电力负荷模型源码+项目说明(高分项目).zip
esp8266 RTOS SDK 开发环境配置
基于深度学习的预测区域电力负荷模型源码+项目说明(高分项目).zip
合并两个有序链表是一个常见的编程问题.txt
打开注册表的方法有多种,以下是其中的几种常见方法.txt
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功