没有合适的资源?快使用搜索试试~ 我知道了~
Replicating-DeepMind:复现 DeepMind 的“Playing Atari with Deep Reinf...
共936个文件
cpp:165个
hpp:158个
hxx:134个
需积分: 10 4 下载量 7 浏览量
2021-06-25
20:59:25
上传
评论 1
收藏 28.11MB ZIP 举报
温馨提示
复制-DeepMind 复现 DeepMind 的“Playing Atari with Deep Reinforcement Learning”的结果。 所有信息都在我们的。 进度:系统已启动并在带有 cuda-convnet2 的 GPU 集群上运行。 它可以学习比随机播放更好,但还没有好多少:) 它相当快,但仍然比 DeepMind 的原始系统慢 2 倍。 目前它没有实现 RMSprop,这是我们的下一个目标。 注1:您也可以查看我们写的一篇科普文章到 。 注 2:Nathan Sprague 有一个基于 Theano 的实现。 它可以做得相当好。 有关更多详细信息,请参阅 。
资源详情
资源评论
资源推荐
收起资源包目录
Replicating-DeepMind:复现 DeepMind 的“Playing Atari with Deep Reinforcement Learning”的结果 (936个子文件)
ale 1.33MB
report.aux 5KB
report.tex.bak 12KB
report.bbl 3KB
report.bib 3KB
space_invaders.bin 4KB
space_invaders.bin 4KB
seaquest.bin 4KB
seaquest.bin 4KB
breakout.bin 2KB
breakout.bin 2KB
report.blg 888B
shift.c 252KB
unzip.c 37KB
unzip.c 37KB
opsynth.c 17KB
opsynth.c 17KB
phtoelm.c 9KB
phtoelm.c 9KB
holmes.c 9KB
holmes.c 9KB
RLGlueAgent.c 4KB
RLGlueAgent.c 4KB
RLGlueExperiment.c 3KB
RLGlueExperiment.c 3KB
darray.c 3KB
darray.c 3KB
trie.c 2KB
trie.c 2KB
elements.c 2KB
elements.c 2KB
phones.c 1KB
phones.c 1KB
layers-imagenet-2gpu-model.cfg 3KB
layers-imagenet-4gpu-data-model.cfg 3KB
layer-params-imagenet-2gpu-model.cfg 3KB
layer-params-imagenet-4gpu-data-model.cfg 2KB
layers-imagenet-1gpu.cfg 1KB
layers-imagenet-4gpu-data.cfg 1KB
layers-imagenet-2gpu-data.cfg 1KB
layer-params-imagenet-1gpu.cfg 1KB
layer-params-imagenet-4gpu-data.cfg 1KB
layer-params-imagenet-2gpu-data.cfg 1KB
layer-params-cifar10-11pct.cfg 1KB
layers-cifar10-11pct.cfg 990B
deepmind-layers.cfg 625B
deepmind-layers.cfg 624B
deepmind-params.cfg 253B
deepmind-params.cfg 253B
ChangeLog 1023B
ChangeLog 1023B
COPYING 18KB
COPYING 18KB
matrix.cpp 25KB
ale_state.cpp 13KB
ale_state.cpp 13KB
export_screen.cpp 12KB
export_screen.cpp 12KB
stella_environment.cpp 8KB
stella_environment.cpp 8KB
rlglue_controller.cpp 8KB
rlglue_controller.cpp 8KB
fifo_controller.cpp 6KB
fifo_controller.cpp 6KB
display_screen.cpp 6KB
display_screen.cpp 6KB
PlayerAgent.cpp 5KB
PlayerAgent.cpp 5KB
jpeg.cpp 5KB
Roms.cpp 5KB
Roms.cpp 5KB
SDLKeyboardAgent.cpp 5KB
SDLKeyboardAgent.cpp 5KB
pyext.cpp 4KB
internal_controller.cpp 4KB
internal_controller.cpp 4KB
RiverRaid.cpp 4KB
RiverRaid.cpp 4KB
phosphor_blend.cpp 3KB
phosphor_blend.cpp 3KB
Tennis.cpp 3KB
Tennis.cpp 3KB
BattleZone.cpp 3KB
BattleZone.cpp 3KB
Boxing.cpp 3KB
Boxing.cpp 3KB
StarGunner.cpp 3KB
StarGunner.cpp 3KB
RoadRunner.cpp 3KB
RoadRunner.cpp 3KB
Alien.cpp 3KB
Alien.cpp 3KB
Enduro.cpp 3KB
Enduro.cpp 3KB
ElevatorAction.cpp 3KB
ElevatorAction.cpp 3KB
JourneyEscape.cpp 3KB
JourneyEscape.cpp 3KB
DoubleDunk.cpp 3KB
DoubleDunk.cpp 3KB
共 936 条
- 1
- 2
- 3
- 4
- 5
- 6
- 10
syviahk
- 粉丝: 24
- 资源: 4783
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于matlab实现夜间车牌识别程序(1).rar
- 基于matlab实现无线传感器网络无需测距定位算法matlab源代码 包括apit,dv-hop,amorphous在内的共7个
- 基于python的yolov5实现的旋转目标检测
- 基于matlab实现无线传感器网络 CAB定位仿真程序 这是无线传感器节点定位CAB算法的仿真程序,由matlab完成.rar
- 基于matlab实现图像处理,本程序使用背景差分法对来往车辆进行检测和跟踪.rar
- 基于matlab实现视频监控中车型识别代码,自己写的,希望和大家多多交流.rar
- springcodespringcodespringcodespringcode
- 基于matlab实现权值的MAXDEV无线传感器网络定位算法研究 MAXDEV 无线传感器 定位 算法.rar
- sdk.config
- 基于matlab实现配电网三相潮流计算方法,对几种常用的配电网潮流计算方法进行了对比分析.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0