《人工智能与信息社会》课程中,陈斌教授深入讲解了从国际象棋到围棋的人工智能发展历程,聚焦于基于决策树和搜索的智能系统。在国际象棋领域,早期的人工智能程序如深蓝,利用AlphaBeta剪枝优化搜索算法,结合残局库和开局库以增强搜索效率和深度,能够与顶尖人类棋手对抗。
AlphaBeta剪枝是搜索算法中的关键优化,它避免了在无用的分支上进行计算,从而节省了大量的计算资源。在围棋方面,早期的程序如GNU Go利用AlphaBeta算法,其水平大致相当于业余5至10级。在CGOS(围棋在线服务器)上,GNU Go被用作基准水平进行比较。
随着蒙特卡洛方法的发展,人工智能在围棋领域的表现显著提升。蒙特卡洛方法通过随机采样来获取近似的解决方案,是一种通用的计算策略。蒙特卡洛树搜索(MCTS)结合了蒙特卡洛方法和决策树,通过反复的随机采样、选择、扩张、模拟和反馈来构建决策树,从而找到最优的围棋走法。在这个过程中,树策略负责选择节点并创建新节点,而模拟和反馈则涉及从当前状态进行游戏模拟,直到结束并评估结果。
MCTS在围棋程序中取得了显著成就,如MoGo是第一个采用MCTS的围棋程序,在2006年9×9的小棋盘上战胜了职业棋手。随后的DeepZenGo是AlphaGo之前最强大的围棋程序,能与职业棋士相差3到4子的水平。
AlphaGo的出现将围棋AI推向了一个新的高度。它在MCTS的基础上,结合深度学习的神经网络,训练出更优秀的树策略和价值函数。通过大量的自我对弈,AlphaGo不仅学会了人类的围棋知识,还能自我创新,最终在2016年击败了世界冠军李世石,标志着人工智能在复杂策略游戏中取得了里程碑式的胜利。
从国际象棋到围棋,人工智能的发展历程展示了决策树、搜索算法、蒙特卡洛方法以及深度学习的逐步进步和融合。这些技术的进步不仅推动了人工智能在棋类游戏中的表现,也为其他领域的智能决策提供了宝贵的经验和理论基础。