没有合适的资源?快使用搜索试试~ 我知道了~
AlphaToe, 运用Alpha学习技巧 play tic toe.zip
共48个文件
py:41个
gitignore:1个
md:1个
需积分: 10 0 下载量 200 浏览量
2019-09-17
18:14:56
上传
评论
收藏 958KB ZIP 举报
温馨提示
AlphaToe, 运用Alpha学习技巧 play tic toe AlphaToe从Alpha到tic-tac-toe的深层学习技巧这些是我演讲的代码示例,幻灯片在 AlphaToe.pdf 中除了幻灯片,文件脚本/policy_gradient 。py是项目的一个很好的起点。 所有网络都使用Te
资源推荐
资源详情
资源评论
收起资源包目录
AlphaToe.zip (48个子文件)
AlphaToe-master
.gitignore 1KB
README.md 695B
policy_gradient.py 2KB
tests
games
__init__.py 0B
test_tic_tac_toe_x.py 3KB
test_connect_4.py 956B
__init__.py 0B
common
test_network_helpers.py 3KB
__init__.py 0B
techniques
test_train_policy_gradient_historic.py 512B
test_min_max.py 1KB
__init__.py 0B
test_train_policy_gradient.py 2KB
test_create_positions_set.py 512B
games
connect_4.py 8KB
tic_tac_toe_x.py 11KB
tic_tac_toe.py 6KB
__init__.py 0B
value_network.py 5KB
LICENSE 1KB
Alpha Toe.pdf 475KB
common
base_game_spec.py 6KB
__init__.py 0B
benchmark.py 5KB
network_helpers.py 9KB
requirements.txt 17B
connect_4
position_connect_4_min_max_depth_6 1.26MB
train_vs_min_max.py 720B
train_historical.py 630B
__init__.py 0B
network.py 4KB
supervised.py 1KB
policy_gradient_historical_competition.py 1KB
techniques
min_max.py 6KB
train_policy_gradient_historic.py 7KB
train_supervised.py 5KB
train_value_network.py 5KB
monte_carlo_uct_with_value.py 3KB
__init__.py 0B
train_policy_gradient.py 5KB
create_positions_set.py 3KB
monte_carlo.py 6KB
tic_tac_toe_5_4
train_vs_min_max.py 744B
train_historical.py 647B
__init__.py 0B
position_tic_tac_toe_5_4_min_max_depth_6 660KB
network.py 4KB
supervised.py 1KB
共 48 条
- 1
资源评论
weixin_38743737
- 粉丝: 376
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功