# deeprm_reforement_learning
- 本项目基于[hongzimao/deeprm](https://github.com/hongzimao/deeprm),原作者还著有论文[Resource Management with Deep Reinforcement Learning](http://www.microsoft.com/en-us/research/wp-content/uploads/2017/01/deeprm_hotnets16.pdf) 。
- 原作者使用的神经网络框架是 Theano。但是Yoshua Bengio 在2017年9月28日通过公开信的形式宣布 Theano 停止更新维护。所以我准备将Theano替换为目前更为流行的 Tensorflow 框架进行二次开发。
- 除去更换框架之外,我希望对深度强化学习算法进行多种尝试。包括但不限于policy_grandient、A2C、A3C、DDPG、PPO等,每种算法以不同的文件夹名区分。
- 强化学习参考[MorvanZhou/Reinforcement-learning-with-tensorflow](https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow),莫烦的视频通俗易懂,强推。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python源码.zip 毕业设计基于深度强化学习的资源调度研究python源码.zip
资源推荐
资源详情
资源评论
收起资源包目录
毕业设计基于深度强化学习的资源调度研究python源码.zip (22个子文件)
code
policy_gradient
parameters.py 4KB
job_distribution.py 3KB
other_agents.py 3KB
run_script.py 1KB
environment.py 17KB
readme.md 277B
RL_brain.py 6KB
pg_re.py 12KB
launcher.py 6KB
slow_down_cdf.py 6KB
README.md 905B
A2C
parameters.py 4KB
job_distribution.py 3KB
other_agents.py 3KB
run_script.py 1KB
environment.py 17KB
readme.md 450B
actor_critic_brain.py 4KB
RL_brain.py 4KB
pg_re.py 10KB
launcher.py 5KB
slow_down_cdf.py 6KB
共 22 条
- 1
资源评论
FL1768317420
- 粉丝: 4850
- 资源: 5725
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功