实验二 四子棋机器对弈
韩荣 2016010189 计 71 han-r16@mails.tsinghua.edu.cn 18811669931
Contents
1、问题描述 ........................................................................................................................................ 1
2、文件说明 ........................................................................................................................................ 4
3、模型原理 ........................................................................................................................................ 4
3.1 蒙特卡罗评估 .................................................................................................................................. 2
3.2 蒙特卡罗树搜索(MCST) ........................................................................................................... 2
3.3 UCB 算法和 UCT 算法 ..................................................................................................................... 2
3.4 针对 MCST 的一些优化 ................................................................................................................. 2
3.5 针对计算时间的一些优化 .............................................................................................................. 2
3.6 针对空间的一些优化 ...................................................................................................................... 2
4、算法测试 ........................................................................................................................................ 4
5、模型分析 ........................................................................................................................................ 4
5.1 MCST 的优势与不足 ....................................................................................................................... 3
5.2 结果的记录规则 .............................................................................................................................. 2
5.3 UCT 信心计算常数的选择 .............................................................................................................. 2
5.4 MCST 的实现 .................................................................................................................................... 2
6、实验结果 ........................................................................................................................................ 4
6.1 与各 dylib 对战的结果 ................................................................................................................... 2
6.2 胜率分析及人机对战 ...................................................................................................................... 2
6.3 可能的改进方向 .............................................................................................................................. 2
7、收获与总结 .................................................................................................................................... 4
7.1 关于本次实验的一些思考 .............................................................................................................. 2
7.2 实验收获 ........................................................................................................................................... 2
7.3 实验小结 ........................................................................................................................................... 2
8、附录
................................................................................................................................................. 4
评论0