没有合适的资源?快使用搜索试试~ 我知道了~
基于高校招生数据的数据分析及应用研究1
需积分: 0 0 下载量 106 浏览量
2022-08-03
14:06:44
上传
评论
收藏 2.46MB PDF 举报
温馨提示
试读
25页
摘要1目录 31.前言 41.1 研究背景 41.2 研究意义 41.3 国内外相关研究状况综述 51.4 本文的特色与创新 61.5 本文的主要内容 62.
资源推荐
资源详情
资源评论
基于高校招生数据的数据分析及应用研究
摘要
本文主要通过爬虫技术对中国高校网披露的 2007 年至 2017 年除国防科技
大学外 38 所 985 高校在各省文理科专业录取分数情况,并根据实际要求对原数
据进行数据清洗、缺失值填补、分组整合等处理,结合特征工程对数据进行探
索性分析,统计处各高校近年来开设专业数量的变化趋势、最具竞争力、潜力
及最不具竞争力、潜力专业。
在模型方面,本文巧用批次投档分及状元总分为对照目标,利用深度学习
算法 LSTM(长短记忆神经网络)预测出下年各专业相对门槛,并通过层次分
析法模型为考生两两对比所有决策方案,建立一个高考招生推荐系统;为其推
荐相应高校和专业。LSTM 的预测精度非常高,具有很好的现实意义,且层次
分析法中判别矩阵的一致性检验机制能尽量降低因个人主观对比偏差过大而导
致模型失去客观性,整体模型实用而科学。
关键词:
爬虫;LSTM;层次分析法;高校招生;推荐系统
Abstract
This article mainly uses the crawler technology to disclose the scores of the 985
colleges and universities in the provinces and universities except the National
University of Defense Technology in 2007 to 2017. In addition, according to the
actual requirements, the original data is cleaned and the missing values are filled.
Group integration and other processing, combined with feature engineering to
exploratory analysis of data, the statistical offices of various universities in recent
years to open a professional number of trends, the most competitive, potential and
least competitive, potential professional.
In terms of model, this paper uses the batch voting score and the total score of
the champion to be compared with the control target. The deep learning algorithm
LSTM (long and short memory neural network) is used to predict the relative
threshold of each major in the next year, and the analytic hierarchy process model is
used for two pairs of candidates. More than all decision-making programs, establish a
college entrance examination recommendation system; recommend corresponding
universities and majors. The prediction accuracy of LSTM is very high, and it has
good practical significance, and the consistency check mechanism of discriminant
matrix in AHP can try to be as far as possible. Reducing the model's loss of
objectivity due to excessive subjective contrast bias, the overall model is practical and
scientific.
Key Words
:
reptile; LSTM; analytic hierarchy process; college
admissions; recommendation system
目录
摘要 ........................................................................................................................... 1
Abstract ................................................................................................................... 2
目录 ........................................................................................................................... 3
1.前言 ........................................................................................................................ 4
1.1 研究背景 .................................................................................................................... 4
1.2 研究意义 .................................................................................................................... 4
1.3 国内外相关研究状况综述 ...................................................................................... 5
1.4 本文的特色与创新 ................................................................................................... 6
1.5 本文的主要内容 ....................................................................................................... 6
2. 高校招生数据分析 ............................................................................................. 7
2.1 数据说明 ................................................................................................................... 7
2.2 数据清洗及特征工程 ................................................................................................ 8
2.2.1 数据清洗 ......................................................................................................................... 8
2.2.1 新增内生特征 ................................................................................................................ 9
2.2.3 缺失数据填充及插值 ............................................................................................... 10
2.2.4 探索性分析 ................................................................................................................. 12
3. 高校及专业推荐系统模型 .............................................................................. 16
3.1 层次分析法量化高校专业匹配程度 .................................................................... 17
3.2 基于 LSTM 的高校专业竞争力水平预测 ............................................................. 19
3.2.1 LSTM 原理说明 ........................................................................................................... 19
3.2.2 基于 LSTM 的高校专业竞争力水平预测 ............................................................ 22
5.总结与展望 ......................................................................................................... 23
5.1 测试环境 ................................................................................................................. 23
5.2 模型评价 ................................................................................................................. 23
5.3 研究展望 ................................................................................................................. 24
参考文献 ................................................................................................................. 25
1.
前言
1.1 研究背景
自 1977 年恢复高考制度以来,各大高校院系不断根据科学体系的发展而调
整开设的专业门类,并在至今 40 年间招收了无数来自不同地区、不同类型的学
生。这些考生的录取结果共同汇成了一个大型数据库,并每年为下一届的高考
考生作为选择大学的参考文库。高校间、各专业间的录取分数对比可以体现出
高校和专业间的受欢迎程度,同时也能间接反映出社会与学校间不同专业人才
的需求供应关系。
而作为考生,面对历年各大高校数百万条录取情况,不容易发现其中的规
律或是专业趋势,导致投档了与自己实力不符合的学校及专业,从而影响了人
生格局等。因此为广大考生建立一个高考录取招生分析系统有着现实需求及价
值。
1.2 研究意义
招生数据分析也具有一定的理论意义。随着全球信息化的发展,信息技术
广泛应用于各个领域。2002 年,我国实现高等学校招生网上录取,为招生工作
带来了革命性的变化,同时也使得信息技术为招生工作服务成为可能。十几年
来,计算机管理着大量的招生数据。招生管理系统只是对原始的招生数据进行
简单的汇总和加工,无法转换成有价值的信息以对下一步的工作进行指导。而
数据挖掘技术能够对大型、复杂的数据集进行高效、快速的分析,能够发现隐
藏在数据背后的数据之间的关联、趋势及方向。
招生数据分析具有很重大的实际意义,在数百万条考生数据中,蕴藏着丰
富的决策信息和知识。如何开发和利用这些宝贵的信息资源,是服务高考录取
工作、指导考生科学地填报志愿的一项重要任务,也是目前迫切需要解决的问
题。高考志愿分析是高考数据分析的一个重要组成部分,它主要以考生志愿数
据为依据,根据志愿相关的各个属性分析高考录取的情况。其中得到的各种知
剩余24页未读,继续阅读
资源评论
不知者无胃口
- 粉丝: 27
- 资源: 328
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功