没有合适的资源?快使用搜索试试~ 我知道了~
deep-reinforcement-learning:加州大学伯克利分校CS 294的编程作业和讲座
共67个文件
pdf:24个
py:21个
pkl:6个
需积分: 10 1 下载量 138 浏览量
2021-05-01
09:20:53
上传
评论
收藏 80.54MB ZIP 举报
温馨提示
讲师:Sergey Levine,John Schulman和Chelsea Finn。 本课程将假设您对强化学习,数值优化和机器学习有所了解。 该课程涵盖以下主题:有监督的学习和决策; 基本强化学习:Q学习和策略梯度; 高级模型学习和预测; 高级深度强化学习:信任区域政策梯度,行为者批评方法,探索; 公开问题和研究讲座。 目录 讲课 第1课:简介和课程概述( )( ) 第2课:有监督的学习和模仿( )( ) 第3讲:强化学习简介( )( ) 讲座4:政策梯度介绍( )( ) 讲座5:演员评论导论( )( ) 讲座6:值函数介绍( )( ) 第7课:高级Q学习算法( )( 幻灯片) 讲座8:最佳控制和计划( 视频)( 幻灯片) 第9课:从数据学习动态系统( 视频)( 幻灯片) 第10课:通过模仿最佳控制器来学习策略( 视频)( 幻灯片) 客座演讲:高级模型学习和图像(
资源详情
资源评论
资源推荐
收起资源包目录
deep-reinforcement-learning-master.zip (67个子文件)
deep-reinforcement-learning-master
Lectures
lecture_1_introduction.pdf 3.41MB
guest_lecture_advanced_model_learning.pdf 28.46MB
lecture_3_rl_intro.pdf 2.17MB
lecture_12_inverse_reinforcement_learning.pdf 3.82MB
lecture_16_meta_learning.pdf 2.58MB
lecture_14_transfer.pdf 3.6MB
lecture_13_exploration.pdf 2.87MB
lecture_9_model_based_rl.pdf 3.75MB
lecture_17_challenges.pdf 3.22MB
lecture_8_model_based_planning.pdf 2.72MB
lecture_2_behavior_cloning.pdf 2.36MB
lecture_10_imitating_optimal_control.pdf 3.21MB
lecture_6_value_functions.pdf 2.14MB
lecture_13_advanced_pg.pdf 847KB
lecture_7_advanced_q_learning.pdf 2.6MB
tf_review_session.pdf 239KB
lecture_4_policy_gradient.pdf 2.44MB
lecture_5_actor_critic_pdf.pdf 2.35MB
lecture_15_multi_task_learning.pdf 2.95MB
lecture_11_control_and_inference.pdf 2.52MB
LICENSE 1KB
hw3
atari_wrappers.py 5KB
run_dqn_ram.py 4KB
dqn.py 15KB
run_dqn_atari.py 4KB
README 196B
dqn_utils.py 13KB
README.md 7KB
hw2
fig
2_cartpole_lb.png 144KB
5_hc.png 81KB
4_nn_baseline.png 194KB
2_cartpole_sb_lb.png 150KB
1_cartpole_sb.png 190KB
3_pendulum_2x16.png 122KB
logz.py 3KB
README.md 6KB
train_pg.py 23KB
plot.py 3KB
hw1
run_cloning.py 4KB
dagger.py 5KB
tf_util.py 17KB
experts
Reacher-v1.pkl 63KB
Hopper-v1.pkl 64KB
Humanoid-v1.pkl 367KB
HalfCheetah-v1.pkl 71KB
Ant-v1.pkl 148KB
Walker2d-v1.pkl 71KB
demo.bash 174B
load_policy.py 2KB
load_policy.pyc 3KB
README.md 719B
plotting.py 2KB
tf_util.pyc 24KB
run_expert.py 2KB
Assignments
hw1fall2017.pdf 94KB
hw4_final.pdf 164KB
hw2_final.pdf 149KB
hw3_final.pdf 96KB
hw4
controllers.py 1KB
logz.py 3KB
main.py 11KB
cheetah_env.py 1KB
README.md 3KB
cost_functions.py 2KB
dynamics.py 4KB
plot.py 3KB
Hopper_Backflips.gif 4.68MB
共 67 条
- 1
罗志鹏铂涛全品牌投发
- 粉丝: 15
- 资源: 4553
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0