没有合适的资源?快使用搜索试试~ 我知道了~
RL_project_common
共83个文件
py:73个
pdf:2个
gitkeep:2个
需积分: 9 0 下载量 11 浏览量
2021-04-30
15:19:48
上传
评论
收藏 7MB ZIP 举报
温馨提示
深度强化学习的方法 该存储库包含为Capita Selecta进行强化学习而编写的代码。 该报告(和代码)涵盖以下主题: 传统RL(蒙特卡罗,SARSA-λ) 线性值函数近似(线性函数近似SARSA-λ) (深度)基于神经网络的函数逼近(受DQN启发)(深度Q学习,深度SARSA-λ) Actor Critic算法(使用SASA-λ作为值函数逼近器的A2C) SAC-Q( ) 这些算法在多个实验中进行了评估。 除了位于sacx/experiments/mountaincar.py的SAC-Q实验之外,本文中使用的实验全部位于cluster_experiments文件夹中。 如果您想阅读并获得对这些算法的更深入的了解,我们邀请您阅读报告或仔细阅读相关的幻灯片: 一些闪亮的GIF 购物车杆数: 蛇: 依存关系 为了运行实验,需要使用许多不同的Python软件包,包括Ten
资源推荐
资源详情
资源评论
收起资源包目录
RL_project_common-master.zip (83个子文件)
RL_project_common-master
.gitignore 30B
results
.gitkeep 0B
q_network_sarsa_lambda.py 9KB
requirements.txt 1KB
experiments
easy21_sarsa.py 550B
cartpole_deep_sarsa.py 1KB
flappybird_deepq.py 1KB
snake_deep_sarsa.py 1KB
cartpole_ac.py 2KB
snake_convq.py 1KB
pixelcopter_deepq.py 1KB
cartpole_sarsa.py 765B
flappy_bird_a2c.py 2KB
easy21_montecarlo.py 538B
pixelcopter_convq.py 1KB
cartpole_deepq.py 698B
flappy_bird_deep_sarsa.py 2KB
cartpole_deep_sarsa_new.py 2KB
simple_env_sarsa.py 377B
sacx
sacu.py 5KB
multi_task_logger.py 2KB
extcore.py 1KB
__init__.py 0B
experiments
cartpole_sacx.py 1KB
__init__.py 0B
mountaincar_sacx.py 2KB
mock_sacx.py 1KB
puckworld_sacx.py 2KB
mock_tasked_q_network.py 668B
sacq.py 2KB
environments
mock_env.py 983B
mountaincar.py 4KB
__init__.py 0B
generic_tasked_q_network.py 528B
tasked_p_network.py 5KB
puckworld.py 11KB
tasked_q_network.py 10KB
tasked_dual_neural_net.py 2KB
LICENSE 1KB
agent.py 586B
README.md 3KB
environments
cartpole.py 4KB
snake.py 10KB
easy21.py 8KB
pixelcopter.py 5KB
wrappers
standardized_env_wrapper.py 1KB
__init__.py 0B
MultiTaskWrapper.py 919B
simple_env.py 1KB
flappybird.py 3KB
cluster_experiments
snake_deep_sarsa.py 2KB
cartpole_deepsarsalambda.py 3KB
cartpole_ac_comparison.py 5KB
cartpole_sarsalambda.py 3KB
cartpole_ac_param_sweep.py 5KB
snake_conv_sarsa.py 2KB
sandbox
growing_qs.py 491B
__init__.py 139B
keras_multi_models.py 1KB
keras_models_in_tensorflow.py 943B
q_table.py 4KB
agents
deep_q.py 3KB
actor_critic.py 3KB
linear_func_approx.py 5KB
montecarlo.py 2KB
sarsalambda.py 4KB
deep_sarsa.py 4KB
plots
.gitkeep 0B
average_bin_plot_conv_vs_deep.py 2KB
average_bin_plot_ac_vs_sl.py 2KB
multi_plot_from_runs.py 835B
average_bin_plot_sl.py 2KB
test_plot_from_h5.py 502B
q_network.py 4KB
p_network.py 6KB
gifs
cart_pole.gif 1.18MB
snake.gif 592KB
experiment_util.py 7KB
core.py 3KB
q_estimator.py 2KB
policy.py 7KB
methods-deep-reinforcement.pdf 3.2MB
MethodsForDeepRL-Slides.pdf 3.52MB
共 83 条
- 1
资源评论
小马甲不小
- 粉丝: 21
- 资源: 4714
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- week6.1.7z
- 移动机器人自主路径规划之RRTStar算法MATLAB实现代码
- 基于Python+OpenCV+FFmpeg实现自动识别电影剪辑+分析剪辑主题颜色+源码+文档(毕业设计&课程设计&项目开发)
- 基于python的二手商品交易平台 python+django开发的供需平台
- 微信小程序源码 侧滑布局小程序 (源码下载 +内附使用说明)
- heima-JUC-资料
- coreg_FSL.sh
- ROS+YOLOV8+SLAM智能小车导航实战(四、激光雷达+SLAM建图)
- 什么是决策树,有哪些适用场景?
- 基于python开发的口红色号识别程序+源码+开发文档+源码解析(毕业设计&课程设计&项目开发)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功