【免费】基于Monte-Carlo随机模拟算法的2048游戏AI1资源-CSDN文库

人工智能

需积分: 0 4 浏览量 2022-08-03 22:24:12 上传评论收藏 1.53MB PDF 举报

资源详情

资源评论

资源推荐

评委一评分，签名及备注

队号：

10376

评委三评分，签名及备注

评委二评分，签名及备注

选题：

评委四评分，签名及备注

题目：基于 Monte-Carlo 随机模拟算法的 2048 游戏 AI

摘要

2048 是近期网络上流行的一款规则简单的益智游戏。它容易上手，但是想要

获胜也很不容易。本文分析 2048 的游戏过程并完成了求胜 AI 的设计。

首先，本文建立了游戏的博弈模型，分析了其双方的决策集合，游戏的博弈

树和决策分支。本文从理论上分析了良好的决策在博弈树上确定的路径应使得

“在此决策前提下，之后进行随机决策，最后能到达 2048”这一事件的概率不断

增大。

本文基于游戏本身性质，引入一个简单的估价指标——盘面数值之和，来衡

量“从给定游戏局面出发，到达 2048”这一事件的概率。本文在几个特殊局面下

评估了这指标的一些倾向性。

其后，本文利用 Monte-Carlo 随机模拟算法，在某个决策分支点，对四个方

向移动得到的新局面多次独立模拟一定步数的随机操作，得到一定步数后游戏格

局估价指标的期望值的估计；比较其大小，由此确定此决策分支点应做出的决策。

本文利用 matlab 编程实现 AI，并基于不同的取样值、模拟步数的胜率指标对其

进行了评价。

最后，本文分析了 4*4 盘面和 N*N 盘面理论上能够得到的最大数值，对于

N*N 盘面，这个数值是







。

关键字：博弈模型，估价指标，Monte-Carlo 随机模拟

更多数学建模资料请关注微店店铺“数学建模学习交流”

https://k.weidian.com/RHO6PSpA

基于 Monte-Carlo 随机模拟算法的 2048 游戏 AI

1. 问题重述

2048 是近期风靡网络的一款游戏，它的规则很简单：在 4*4 方格盘中有数

字方块，他们均为 2 的正整数次幂。每次控制所有数字方块向同一方向移动，两

个相同数字的方块碰撞时会合并为他们的和，每次操作之后在空白处随机生成一

个 2 或者 4。得到数字 2048 则胜利，格子都被填满且相邻格子都不同——即无

法向任何方向移动，则失败。

针对游戏 2048 建立数学模型，并使用完成游戏所需移动次数和获胜概率两

个指标来评估算法的表现。同时，讨论 4*4 方格盘下，得到 2048 之后，继续进

行游戏所可能达到的最大数值，并将其推广至 N*N 方格盘。

2. 假设与符号说明

2.1 假设

 2.1.1）2048 游戏原作者做出的设定、规则和胜负判定在每次操作中都被玩

家和系统遵从。主要包括以下三点：

- 玩家每次操作向一个方向移动数字方块。

- 系统移动方块穿过空格直到它碰到其他方块为止。

- 系统每次移动中只能合并一次方块，不能连续合并。

举例来说，列[0，2，2，4]在一次右移操作后变成[0，0，4，4]，而不是[0，

0，0，8]；形成后者需要两次右移操作。

 2.1.2）玩家每次操作后，系统生成新数字方块的位置随机取。在玩家第一次

操作前，系统首先在空白方格盘上随机生成一个 2 或 4。系统每次生成 4 的

概率为 10%，生成 2 的概率为 90%。（依据 2048 源代码）

 2.1.3）忽略伪随机数种子及其内在局限性、规律性对计算机随机模拟程度的

影响。即当本文中提到任何“随机”概念时，均指不可预测的真正意义上的

随机。

2.2 符号说明

表 1-参变量符号说明

名称

含义





第 k+1 次操作前的格局，详见问题分析部分。





游戏结束时的最终格局。





󰇛



󰇜

第 k+1 次滑动操作，为向右滑动。相似地其他方向参见下标。详见

问题分析部分。

󰇛





󰇜

第 k+1 次滑动操作后生成随机数字方格的生成操作，详见问题分

析。



进行 Monte-Carlo 模拟的样本容量。



进行 Monte-Carlo 模拟的运行深度。

󰇛



󰇜

对格局



的估价函数。

剩余23页未读，继续阅读

评论收藏

内容反馈

Crazyanti

粉丝: 16
资源: 303

基于 Monte-Carlo 随机模拟算法的 2048 游戏 AI 1

评论0

最新资源

基于 Monte-Carlo 随机模拟算法的 2048 游戏 AI 1

评论0

基于Monte Carlo模拟的完全随机缺失数据处理方法效果比较.pdf

金融领域的随机建模与基于软件R的Monte Carlo模拟（2）：Cox-Ross-Rubinstein 模型 (2015年)

图的最小切割的Monte Carlo算法模拟;大素数测试的Monte Carlo算法实现;实验11 模式匹配的随机算法实现

金融领域的随机建模与基于软件R的Monte Carlo模拟（ 1）：金融期权 (2015年)

基于Monte Carlo模拟的四种完全随机双变量缺失数据处理方法的比较.pdf

Monte-Carlo-Tree-Search-Filler-AI

java （人工智能大作业玩转黑白棋项目源码）黑白棋源码加文档.zip

unity 期末大作业-五子棋游戏

一个中国象棋程序和一个配套的基于蒙特卡洛算法及神经网络的人工智能（模仿阿尔法狗）.zip

基于Qt+Python及AI算法开发的Windows平台2048游戏源码+说明+sln解决方案(课程设计).zip

人工智能应用举例.ppt

CMPUT355HexKitties

无线传感器网络仿真基于Omnet＋＋

一个蒙特卡洛树搜索算法实现的五子棋 AI，现可用神经网络训练模型。.zip

alphago-zero-tictactoe-js:一个基于AlphaZeroTensorFlow.js的游戏框架在浏览器中运行，以演示井字游戏AI游戏。 使用预先训练的模型或从头开始训练。 从suragnairalpha-zero-general（Python）移植

reinforcement-learning-master.zip

使用机器学习算法在人寿保险公司中进行代理建模-研究论文

基于 Vox Populi 的参与决策对​​内源截断偏差的半参数校正-研究论文

mcts_2048:蒙特卡洛树搜索在终端播放2048

a-nice-mc:代码为“ A-NICE-MC

无线传感器网络仿真

sokoban-ai:教AI使用单层蒙特卡洛树搜索解决Sokoban问题

connect4-ai:Ai连接4

最新版ISO/IEC 27001:2022、ISO 27002:2022中英文合集

Goby红队版-win-x64-2.4.7版本

Chrome Header Editor 插件

ISO SAE 21434-2021 中文版.pdf

OpenVAS GVM 中文翻译补丁

最新资源

alphago-zero-tictactoe-js:一个基于AlphaZeroTensorFlow.js的游戏框架在浏览器中运行，以演示井字游戏AI游戏。使用预先训练的模型或从头开始训练。从suragnairalpha-zero-general（Python）移植

基于 Vox Populi 的参与决策对内源截断偏差的半参数校正-研究论文