没有合适的资源?快使用搜索试试~ 我知道了~
DDPG连续控制
共65个文件
py:49个
md:3个
json:3个
需积分: 38 2 下载量 193 浏览量
2021-02-18
18:53:10
上传
评论 3
收藏 1.27MB ZIP 举报
温馨提示
Unity带有RL的Reacher环境解决方案 介绍 该项目是用于解决Unity v0.4环境的深度确定性策略梯度强化学习算法的实现。 环境细节 在这种环境下,双臂可以移动到目标位置。 对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。 因此,代理的目标是将其在目标位置的位置保持尽可能多的时间步长。 观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。 每个动作是一个带有四个数字的向量,对应于适用于两个关节的扭矩。 动作向量中的每个条目都应为-1和1之间的数字。 该环境由20个相同的代理组成,每个代理都有自己的环境副本。 要考虑解决此环境,特工必须获得+30的平均分数(连续100次以上以及所有特工均达到)。 具体来说, 在每个情节之后,我们将汇总每个代理商的奖励(不打折),以获得每个代理商的得分。 这将产生20个(可能不同)的分数。 然后,我们取这20个分
资源推荐
资源详情
资源评论
收起资源包目录
DDPG-Continous-Control-main.zip (65个子文件)
DDPG-Continous-Control-main
checkpoint_actor.pth 538KB
ddpg_agent.py 9KB
imgs
algorithm.png 186KB
graph.png 13KB
checkpoint_critic.pth 539KB
model.py 3KB
REPORT.md 6KB
LICENSE 1KB
Continuous_Control.ipynb 36KB
README.md 4KB
.gitignore 2KB
python
unityagents
curriculum.py 4KB
brain.py 3KB
communicator.py 1KB
socket_communicator.py 4KB
exception.py 2KB
rpc_communicator.py 4KB
__init__.py 99B
environment.py 24KB
trainer_config.yaml 4KB
requirements.txt 153B
curricula
push.json 555B
test.json 275B
wall.json 320B
setup.py 874B
README.md 273B
learn.py 4KB
Basics.ipynb 6KB
communicator_objects
space_type_proto_pb2.py 2KB
agent_info_proto_pb2.py 6KB
unity_rl_output_pb2.py 7KB
unity_message_pb2.py 4KB
unity_to_external_pb2_grpc.py 2KB
header_pb2.py 3KB
__init__.py 720B
resolution_proto_pb2.py 3KB
engine_configuration_proto_pb2.py 4KB
unity_rl_initialization_output_pb2.py 5KB
brain_type_proto_pb2.py 2KB
command_proto_pb2.py 2KB
environment_parameters_proto_pb2.py 5KB
unity_rl_input_pb2.py 8KB
agent_action_proto_pb2.py 3KB
unity_rl_initialization_input_pb2.py 2KB
unity_output_pb2.py 4KB
unity_to_external_pb2.py 2KB
brain_parameters_proto_pb2.py 7KB
unity_input_pb2.py 4KB
tests
test_unitytrainers.py 7KB
test_ppo.py 13KB
test_unityagents.py 6KB
mock_communicator.py 3KB
__init__.py 54B
test_bc.py 4KB
unitytrainers
buffer.py 11KB
bc
__init__.py 45B
models.py 3KB
trainer.py 15KB
trainer_controller.py 15KB
__init__.py 182B
models.py 17KB
ppo
__init__.py 45B
models.py 13KB
trainer.py 29KB
trainer.py 7KB
共 65 条
- 1
资源评论
吾自行
- 粉丝: 58
- 资源: 4670
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- vscode配置c/c 环境教程
- vscode配置c/c 环境教程
- 基于matlab实现电磁优化计算功能,进行线型规划优化电磁设计.rar
- 基于matlab实现带精英策略的非支配排序遗传算法matlab 源码.rar
- 基于matlab实现差分进化算法,最新的用于替代遗传算法,是以后的主要发展方法.rar
- VSCode配置c/c++环境教程.md
- 基于matlab实现标准合作型协同进化遗传算法matlab源程序
- 七下人教.zip
- 基于matlab实现本份代码能对图像进行gabor滤波处理,结合指纹方向图以及指纹沟壑频率特性,对指纹图像进行增强.rar
- 基于matlab实现RBM神经网络实现了手写数字体识别的GUI程序.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功