残差策略网络在计算机围棋的应用研究_吴修竹.caj

需积分: 9 2 下载量 179 浏览量 2019-08-04 20:56:51 上传评论收藏 6.18MB CAJ 举报

温馨提示

虽然近年来人工智能技术在各个领域中迅速发展,但是围棋因其自身的复杂度一直以来都是人工智能领域中的难解之题,一直到两三年前,国际学术界仍普遍认为真正解决围棋问题至少需要10到20年的时间。为了解决这一问题,DeepMind公司设计的AlphaGo计算机围棋将卷积神经网络带入到计算机围棋的问题中,通过该方法AlphaGo战胜了代表围棋职业棋手顶尖水平的李世石九段与柯杰九段,宣告了人类真正在人工智能领域上解决了围棋问题,而如何进一步提高计算机围棋棋力成为学者们继续探索的方向。提高计算机围棋棋力的主要方法是提高计算机围棋中卷积神经网络的正确率,但是随着网络层数加深,卷积神经网络会因为网络过于复杂出现过拟合的情况。前微软研究员何凯明法发明的深度残差网络有效的解决了这一问题,深度残差网络可以极大的增强深度学习网络的表达能力,使其能够轻松的训练高达150层的网络,从而实现网络精度的提高。本文在研究AlphaGo中策略网络模型的基础上,设计了策略网络与深度残差网络相结合的残差策略网络,从而实现计算机围棋棋力的提高。本文首先对AlphaGo中的策略网络模型以及深度残差网络的基本原理进行了研究。其次根据策略网络的要求进行数据收集、整理以及处理的工作,并根据这些数据复现了 AlphaGo的策略网络。之后本在此基础上本文完成了对残差策略网络的数据,并使用相同数据对残差策略网络进行了实现与训练。最终经过实验比较发现,残差策略网络与比原始的策略网络相比具有更高的精度,可以有效的提高计算机围棋的棋力。

资源推荐

资源评论