没有合适的资源?快使用搜索试试~ 我知道了~
Reinforcement-Learning:通用RL算法的开源重实现
共72个文件
py:67个
md:2个
gitignore:1个
需积分: 9 0 下载量 124 浏览量
2021-04-29
23:29:13
上传
评论
收藏 43KB ZIP 举报
温馨提示
该库实现了强化学习代理的核心组件。 目标是拥有可灵活组合在一起的可重用组件,以解决各种情况。 安装 检出此软件包并将其安装到您的Python发行版中。 $ git clone https://github.com/tomasruizt/Reinforcement-Learning.git $ cd Reinforcement-Learning $ pip install . 用法 该库按层次结构进行构造。 您可以从每个层次结构中导入组件,并以此方式构成您的强化学习代理。 例如: from rl . policy . EpsilonGreedy import EpsilonGreedy from rl . estimation_updater . MonteCarlo import MonteCarlo mc = MonteCarlo ()
资源推荐
资源详情
资源评论
收起资源包目录
Reinforcement-Learning-master.zip (72个子文件)
Reinforcement-Learning-master
LICENSE 11KB
TODO.md 111B
requirements.txt 358B
run_tests.py 112B
setup.py 98B
.gitignore 1KB
rl
environment
__init__.py 67B
DiscreteEnvironment.py 890B
experiment
tests
test_experiment.py 2KB
__init__.py 0B
__init__.py 123B
experiment_configuration.py 1KB
experiment.py 2KB
agent_choice
__init__.py 68B
DiscreteAgentChoice.py 627B
action
discrete_action.py 152B
action_features.py 1KB
action_scores.py 838B
tests
__init__.py 0B
test_action_features.py 1KB
__init__.py 171B
game
tests
test_sequential_game.py 4KB
__init__.py 0B
sequential_game.py 3KB
__init__.py 51B
featurizer
__init__.py 56B
featurizer.py 1KB
learning_algorithm
empirical_monte_carlo.py 2KB
__init__.py 71B
learning_algorithm.py 991B
experience_tuple
experience_tuple_serializer.py 333B
experience_tuple.py 2KB
__init__.py 158B
agent
DiscreteAgent.py 885B
__init__.py 49B
explorator
epsilon_greedy.py 2KB
discrete_explorator.py 563B
tests
test_EpsilonGreedy.py 2KB
__init__.py 0B
__init__.py 120B
episode
episode_serializer.py 1KB
episode.py 1KB
tests
__init__.py 0B
test_episode.py 835B
__init__.py 99B
__init__.py 0B
regressor
linear_regressor.py 3KB
fitting_data.py 968B
tests
test_fitting_data.py 738B
__init__.py 0B
test_linear_regressor.py 3KB
__init__.py 156B
Regressor.py 972B
state
__init__.py 49B
DiscreteState.py 639B
old_lib
test_MonteCarlo.py 729B
UCB.py 1014B
StateActionValues.py 1012B
test
__init__.py 0B
test_UCB.py 676B
TDLambda.py 1KB
interfaces.py 1KB
__init__.py 0B
Policy.py 545B
test_StateActionValues.py 752B
utils
test
test_Softmax.py 807B
__init__.py 0B
__init__.py 27B
LearningRate.py 789B
UpdateRules.py 964B
Softmax.py 159B
README.md 714B
共 72 条
- 1
资源评论
陈崇礼
- 粉丝: 47
- 资源: 4683
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Picasso_v3.1 2.ipa
- chromedriver-mac-arm64.zip
- 蓝zapro.apk
- chromedriver-linux64.zip
- UCAS研一深度学习实验-MNIST手写数字识别python源码+详细注释(高分项目)
- 基于Python和PyTorch框架完成的一个手写数字识别实验源码(带MINIST手写数字数据集)+详细注释(高分项目)
- 基于Matlab在MNIST数据集上利用CNN完成手写体数字识别任务,并实现单层CNN反向传播算法+源代码+文档说明(高分项目)
- NVIDIA驱动、CUDA和Pytorch及其依赖
- 基于SVM多特征融合的微表情识别python源码+项目说明+详细注释(高分课程设计)
- html动态爱心代码一(附源码)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功