没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
学习玩雅达利 这是使用光线分布式处理库的MuZero的实现。 它旨在玩Atari游戏Breakout。 不幸的是,尽管训练将继续进行,但是该模型无法学习。 显然存在未发现的错误或错误的超参数。 超参数在run.py muzero/muzero.py中设置,并在run.py覆盖。 设置 make venv 跑 首先,打开run.py并编辑ray配置,以具有所需的GPU,CPU和内存数量。 目前,它设置为在具有12个内核和64 GB RAM的3 GPU机器上运行。 然后从此仓库的根目录运行 source venv/bin/activate python run.py --logdir ./results --loglevel error breakout Ray仪表板将在。 如果在服务器上运行代码,请运行ssh -L 8265:localhost:8265 username@server以
资源推荐
资源详情
资源评论
收起资源包目录
muzero-ray-master.zip (34个子文件)
muzero-ray-master
.gitignore 56B
README.md 1KB
requirements-dev.txt 95B
LICENSE 1KB
requirements.txt 234B
CONTRIBUTORS 16B
setup.py 1KB
muzero-test-checkpoints.ipynb 18KB
muzero
muzero_tf_policy.py 17KB
mcts.py 15KB
rollout_worker.py 7KB
play.py 2KB
worker_set.py 3KB
util.py 2KB
metrics.py 7KB
learner_thread.py 3KB
trainer.py 14KB
replay_buffer.py 22KB
env.py 7KB
policy.py 5KB
ops
concurrency_ops.py 5KB
rollout_ops.py 9KB
metric_ops.py 7KB
replay_ops.py 8KB
muzero.py 6KB
structure_list.py 5KB
rollout_metrics.py 1KB
debug.py 127B
sample_batch.py 23KB
muzero_tf_model.py 16KB
Makefile 2KB
gcloud_run.py 4KB
requirements-missing.txt 147B
run.py 4KB
共 34 条
- 1
资源评论
观察社
- 粉丝: 21
- 资源: 4689
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于spark和kafka的新闻案例+源代码+文档说明
- greenplum-cc-web-6.2.0-gp6-rhel7-x86-64.7z
- 电机控制霍尔传感器和反电动势的关系分析
- 计算机生产实习:OA后台管理(web前端+Java后端)压缩文件包
- greenplum6.10安装时缺失的fpm包
- 缺陷检测-轻量化PCB表面缺陷检测算法实现-工业视觉+六大缺陷检出-优质项目实战.zip
- JAVA 中的Spring框架介绍包括起源、体系结构、核心部分、特点等
- 2024年小米汽车产业链分析及新品上市全景洞察报告
- 基于Qt和C++实现的偏3D风格的异型窗体界面操作+源码(期末大作业&课设&项目开发)
- 基于yolov8的花卉分类系统,包含训练好的权重和推理代码,GUI界面,支持图片、视频、摄像头输入,支持检测结果导出
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功