# 2023美赛c题
2023美赛只有c题提供了相关数据,为了避免在数据挖掘中出现问题,我们也从众选择了c。Wordle是一个猜字游戏,他的相关算法及其解决方案在GitHub上面已有很多大佬进行了分享,他们的相关算法也对我们的解题提供了宝贵的idea。
### 问题1
在我们观察excel的时候发现存在数据记录错误的问题,如四字的异常单词clen,明显少了的Number of reported results等,由于数据很少,我们就在twitter上找到了对应的数据进行更新。
思路:1.基于现有数据使用**ARIMA模型**建立报告结果数的时间序列回归模型,预测2023年3月1日的报告结果数。结果以当天的 95% 置信区间进行预测。使用**基于生命周期形状提取的分段线性回归**方法提取模型的形状,然后进行聚类,将它识别时间序列模型分为四个阶段来解释Number of reported results的变化趋势。
2.寻找能够描述单词的具体属性,判断这些属性是正向或是负向性并进行归一化之后建立以属性作为自变量,困难模式下报告的各自占比作为因变量列7个回归方程进行预测,这些方程之间也有相应关系,相加之后接近100%。
### 问题2
本题是对于一个**给定的未来日期的解字**建立一个预测模型,我们使用偏最小二乘回归模型由单词属性计算报告占比。由于离散数据较多,本文采用**Apriori算法**建立变量与单词难度的相关规则,并根据其规则的置信度建立混合指标。回归模型中的自变量包括单词出现频率、正交数、字母重复数和混合指数(混合了单词词性、是否属于外来词和是否具有学科专业性三个指标)。最终的预测结果为(**1=0%, 2=2%, 3=15%, 4=33%, 5=30%, 6=16%, X=4%**)。不确定因素有社交媒体、当代新闻、全球流行病等。
### 问题3
为了建立一个难度分类模型,我们通过**系统聚类**的肘部法则将难度分为三类,即为难、中、易,使用簇识别思想根据聚类结果给出分类的相关属性识别,并找出簇中心,以便使用**欧式距离**进行单词难度划分。准确性方面,我们使用**判别分析-回判法**得出类判别矩阵,并根据矩阵得出模型准确性。将eerie的相关属性带入到欧式距离中得出它的难度等级为易。
### 问题4
在数据集中挖掘有趣的特征。
参考了如下网址: http://www.neuro.mcw.edu/mcword/(单词正交型数量)
https://www.english-corpora.org/coca/(COCA语料库)
~~一次数模。终身受益;十次数模,痛哭流涕。~~
最终获得了此次美赛的H奖,感谢我的数模队友。也将本次心路历程作为一个纪念放在这里,也许会有人看到,也许不会。
没有合适的资源?快使用搜索试试~ 我知道了~
毕业设计&课设-2023美赛 MCM C题.zip
共174个文件
pdf:49个
xlsx:35个
png:32个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 135 浏览量
2024-06-22
21:21:15
上传
评论
收藏 59.36MB ZIP 举报
温馨提示
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。
资源推荐
资源详情
资源评论
收起资源包目录
毕业设计&课设-2023美赛 MCM C题.zip (174个子文件)
数据平滑滑动窗口7.bmp 1.51MB
WordDifficulty.csv 1.85MB
mydata.csv 1KB
new.docx 1.71MB
第三问模型.docx 360KB
回归计算.docx 167KB
聚类分析(K-Means)_1 try_2 tries_3 tries.docx 156KB
单词属性.docx 108KB
拟合公式.docx 92KB
公式.docx 87KB
判别模型.docx 83KB
模型.docx 82KB
偏最小二乘法_1 try_2 tries_3 tries.docx 52KB
斯皮尔曼相关系数假设检验.docx 24KB
memo zh.docx 23KB
memo.docx 14KB
第一问上半.docx 13KB
~$23_ICM_Problem_E_FINAL.docx 162B
arima 0 1 13.dta 10KB
确定亚类数量流程图.eddx 17KB
系统聚类算法流程图.eddx 16KB
数据平滑滑动窗口7.fig 36KB
dataset-simple0.html 3KB
相关性.jpg 66KB
memo.md 3KB
1.1 特征识别.md 3KB
README.md 3KB
public version.pdf 7.74MB
Loaded Words in Wordle_ Why the “Best” ...pdf 5.15MB
1906204-已解锁.pdf 4.87MB
【校苑数模公众号】D-2100112 zh.pdf 4.8MB
【校苑数模公众号】D-2100112.pdf 3.95MB
Wordle 中的加载词:为什么“最好的”Wordle 种子词并不是最好的 _ 通过 Chris Chow _ 迈向数据科学.pdf 3.48MB
偏最小二乘法_1 try_2 tries_3 tries.pdf 2.87MB
论文.pdf 2.21MB
s00283-022-10202-0 zh.pdf 1.31MB
new.pdf 1.3MB
多元统计方法是否需要对变量...—以判别分析和聚类分析为例_李子宁.pdf 1.19MB
Selecting_Optimum_Seed_Words_for_Wordle_using_Character_Statistics.pdf 1019KB
Selecting_Optimum_Seed_Words_for_Wordle_using_Character_Statistics zh.pdf 987KB
s00283-022-10202-0.pdf 939KB
final_paper-2022-ivan_li zh.pdf 889KB
j.14671770.1955.tb00829.x.pdf 878KB
j.14671770.1955.tb00829.x zh.pdf 751KB
WORD_DIFFICULTY zh.pdf 701KB
算法.pdf 678KB
算法 zh.pdf 653KB
assessing-word-difficulty-for-quiz-like-game_24852 zh.pdf 585KB
s41524-022-00787-7 zh.pdf 567KB
2023_ICM_Problem_E.pdf 521KB
2023_MCM_Problem_C.pdf 518KB
2023_MCM_Problem_C.pdf 518KB
2023_MCM_Problem_C_CN.pdf 463KB
certificate.pdf 415KB
s41524-022-00787-7.pdf 401KB
final_paper-2022-ivan_li.pdf 393KB
2023_ICM_Problem_F.pdf 372KB
基于模糊C均值聚类和Fis...判别分析的城市空气质量评价_尤游.pdf 338KB
2023_ICM_Problem_D.pdf 314KB
2023_MCM_Problem_A.pdf 307KB
2023_MCM_Problem_A zh.pdf 299KB
assessing-word-difficulty-for-quiz-like-game_24852.pdf 273KB
2023_MCM_Problem_B.pdf 207KB
WORD_DIFFICULTY.pdf 183KB
Visio-偏最小二乘回归.pdf 157KB
2204.04104.pdf 141KB
散点图.pdf 131KB
ARIMA(3,1,12).pdf 104KB
正态分布.pdf 54KB
聚类结果饼状图.pdf 48KB
纯真相关性.pdf 41KB
多重共线性检验.pdf 39KB
相关性.pdf 28KB
评价准确性.pdf 23KB
确定亚类数量流程图.pdf 16KB
系统聚类算法流程图.pdf 15KB
散点图_Page1.png 2.84MB
散点图_Page2.png 451KB
Visio-偏最小二乘回归.png 387KB
确定亚类数量流程图.png 357KB
系统聚类算法流程图.png 327KB
纯真相关性.png 317KB
聚类结果饼状图.png 272KB
ARIMA(0,1,13).png 267KB
ARIMA(3,1,12).png 250KB
评价准确性.png 162KB
聚类散点图.png 131KB
训练集评价准确性.png 107KB
测试集评价准确性.png 105KB
聚类散点图.png 92KB
白噪声检验.png 88KB
正态分布.png 83KB
dataset-simple0.png 71KB
残差ACF.png 59KB
残差PACF.png 57KB
差分后ACF.png 55KB
差分后PACF.png 52KB
补充差分ACF.png 49KB
补充差分PACF.png 47KB
残差正态分布图.png 40KB
共 174 条
- 1
- 2
资源评论
毕业小助手
- 粉丝: 2747
- 资源: 5583
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功