基于SPSS的信息类大学生成绩的数据挖掘实用文档doc.doc

129 浏览量 2022-12-01 05:56:48 上传评论收藏 1.48MB DOC 举报

资源详情

资源评论

基于 SPSS 的信息类大学生成绩

的数据挖掘【实用文档】doc

文档可直接使用可编辑，欢迎下载

应用统计学课程设计

报告名称

基于ＳPSS 的信息类大学生成绩的数据挖掘

学院：河南中医信息技术学院

专业：信息管理与信息系统

班级：信管一班

日期:（提交日期）: 　２014／6／１2

［摘要］数据挖掘技术是信息技术研究的热点问题之一。目前数据挖掘技术在商业、金等

方面都得到了广泛的应用,而在教育领域的应用较少,随着高校招生规模的扩大,在校

学生成绩分布越来越复杂，除了传统成绩分析得到的一些结论外,还有一些不易发现的

信息隐含其中,因而把数据挖掘技术引入到学生成绩分析中,有利于针对性地提高教学

质量.聚类分析是数据挖掘中的一个重要研究领域。它将数据对象分成为若干个簇,使

得在同一个簇中的对象比较相似,而不同簇中的对象差别很大.本论文就是运用数据挖

掘中的聚类分析学生成绩的,利用学生在分专业前的各主要学科的成绩构成，对数据进

行选择，预处理,挖掘分析等。运用聚类算法分析学生对哪个专业的强弱选择，从而为

具有不同成绩特征的同学在专业选择及分专业后如何开展学习提供一定的参考意见。

[关键词］　聚类分析,学生成绩，就业，Ｋ—means，

1、研究背景：

随着我国经济的发展,网络已被应用到各个行业，人们对网络带来的高效率越来越重视,

然而大量数据信息给人们带来方便的同时，也随之带来了许多新问题，大量数据资源的

背后隐藏着许多重要的信息，人们希望能对其进行更深入的分析,以便更好地利用这些

数据，从中找出潜在的规律。那么，如何从大量的数据中提取并发现有用信息以提供决

策的依据,已成为一个新的研究课题。　高校是教学和科研的重要基地，也是培养人才

的重要场所，教学管理工作当中的学生成绩分析是高校管理工作的一个重要组成部分，

也是衡量高校管理水平的依据.从目前来看。各高校随着招生规模的扩大，信息量大幅

度增加,学校运行着各类管理系统,存在着各类数据库，如有成绩管理,学籍管理等。这

些系统积累了大量的数据,在很大程度上提高了工作的效率，但在这样的教学管理系统

中,学校的管理人员、教师和学生都只能通过查看,或者简单的排序以及统计功能来获得

数据表面的信息，由于缺乏信息意识和相应的技术，隐藏在这些大量数据中的信息一直

没有得到充分应用.如何对这些数据进行重新分析利用，在原基础上扩充高校教学管理

系统的功能,从大量数据中发现潜在规律，提高学校管理的决策性，是很多高校正在考

虑的问题。因此,对学生成绩数据进行深入挖掘分析,找出影响学生学习的各种潜在的因

素，将会促进学校开展更加具有针对性的个性化教育，同时营造一种新的教学管理模式，

进一步促进教学管理水平的提高

2、主要原理和思想：

聚类分析就是将一组数据分组，使其具有最大的组内相似性和最小的组间相似性。简单

的说就是达到不同聚类中的数据尽可能不同,而同一聚类中的数据尽可能相似,它与分类

不同，分类是对于目标数据库中存在哪些类这一信息是知道的，所要做的就是将每一条

记录分别属于哪一类标记出来；而聚类是在预先不知道目标数据库到底有多少类的情况

下,希望将所有的记录组成不同的簇或者说“聚类”，并且使得在这种分类情况下，以某

种度量为标准的相似性，在同一聚类之间最小化，而在不同聚类之间最大化。事实上，

聚类算法中很多算法的相似性都基于距离而且由于现实数据库中数据类型的多样性，关

于如何度量两个含有非数值型字段的记录之间的距离的讨论有很多，并提出了相应的算

法。聚类分析的算法可以分为以下几类:划分方法、层次方法等。

2。1聚类分析原理方法：

在数据挖掘技术中,聚类分析主要有以下几种方法.

（１）划分法（Pａrｔitioning Mｅｔｈods）

划分法给定一个有N个元组或者记录的数据集,构造Ｋ个分组,每一个分组就代表一个聚

簇，K〈 N。而且这K个分组满足下列条件:每个组至少包括一个对象，每个对象必须属于

且只属于一个组。对于给定的K，算法首先给出一个初始的分组方法,以后通过反复迭代

的方法改变分组，使得每一次改进之后的分组方案都较前一次好,而所谓好的标准就是：

同一组中的记录越近越好，而不同分组中的记录越远越好。使用这个基本思想的算法有：

K均值算法、K中心点算法、CLARANS算法。K均值算法一般只能在簇的平均值被定义的情

况下才能被使用，这对于涉及有分类属性的数据的应用可能会显得不适用，该方法不易

发现非凸面形状的簇和大小差别很大的簇;K中心点算法在中心点的计算过程中需要反复

迭代计算，其计算量很大，这对于对象及划分数的值较大时，其计算代价相当高。

（２）层次法(Hiｅrarchicaｌ　Methoｄｓ）　

层次法就是把数据库分成多个层次,然后对不同层次的数据采用划分聚类。输出的是一棵

层次化的分类树,层次的方法可以分为凝聚的和分裂的.凝聚的方法也称为自底向上的方

法，一开始将每个对象作为单独的一个组，然后相继地合并相近的对象或组,直到所有的

组合并为一个（层次的最上层）,或者达到一个终止条件.分裂的方法，也称为自顶向下

的方法，一开始将所有的对象置于一个类中。在迭代的每一步中,一个类被分裂为更小的

类。直到最终每个对象在单独的一个类中，或者达到一个终止条件.

３。数据情况介绍：

3。1数据信息:我院某年级学生大学四年全部实际课程数据,分计科、信管１、信管２三

个班级

3.２数据净化

数字净化据源中不正确,不完善等不可能达到数据挖掘质量要求的数据，从而提高数据的质

量得到更正的数据挖掘结果.

研究所针对的学生成绩数据中，遇到的主要是空值问题。对此，本研究采用了两种处理　

方法若该学生有三门及以上成绩为空，则将其作为异常点从数据除去；若该生有两门及

以下课程成绩为空。则取所在班级对应课程的平均成绩来代替空值。

4．分析过程：

第一步，启动并进入ＳPSＳ系统,

剩余60页未读，继续阅读

评论收藏

内容反馈

基于SPSS的信息类大学生成绩的数据挖掘实用文档doc.doc

评论0

最新资源

基于SPSS的信息类大学生成绩的数据挖掘实用文档doc.doc

评论0

最新资源

相关推荐

SPSS分析中学生成绩.doc

基于SPSS Modeler Clementine的数据挖掘(第二版) 全套PPT课件集合 共10个章节 含数据和流文件.rar

完整精品系列SPSS数据分析数据挖掘工具软件实用教程（共26页） - 01 SPSS简介.ppt

基于SPSS统计软件对学生成绩的分析报告.doc

SPSS数据挖掘方法概述.doc

基于SPSS的信息类大学生成绩的数据挖掘(完整资料).doc

基于SPSS Modeler的数据挖掘_数据分析_网盘链接下载108.40M

基于 SPSS 的数据分析（统计数据分析与应用丛书）.doc

《基于SPSS_Modeler的数据挖掘（第二版）》数据和流文件

完整精品系列SPSS数据分析数据挖掘工具软件实用教程（共87页） - 06 相关分析.ppt

数据挖掘 机器学习原理与SPSS Clementine应用宝典 第15章 复杂对象数据挖掘 共111页.ppt

数据挖掘 机器学习原理与SPSS Clementine应用宝典 第2章 数据挖掘可挖掘的知识类型.pdf

数据挖掘 机器学习原理与SPSS Clementine应用宝典 第4章 数据选择.pdf

数据挖掘 机器学习原理与SPSS Clementine应用宝典 第16章 数据挖掘建模 共35页.ppt

数据挖掘 机器学习原理与SPSS Clementine应用宝典 第10章 关联规则 共65页.ppt

数据挖掘 机器学习原理与SPSS Clementine应用宝典 第19章 SPSS Clementine数据管理 共87页.ppt

小白学数据挖掘与机器学习 基于SPSS Modeler实现 含全部数据及模型文件.rar

数据挖掘 机器学习原理与SPSS Clementine应用宝典 第1章 数据挖掘概述.ppt

相关实用应用程序（Windows可用）

免费可用的ChatGPT网页版.zip

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

李飞飞自传 我看见的世界 The World I see

农村公交与异构无人机协同配送优化

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

4个亲测好用的ChatGPT4渠道

基于LSTM的财务因子预测选股模型.zip

基于SPSS Modeler Clementine的数据挖掘(第二版) 全套PPT课件集合共10个章节含数据和流文件.rar

数据挖掘机器学习原理与SPSS Clementine应用宝典第15章复杂对象数据挖掘共111页.ppt

数据挖掘机器学习原理与SPSS Clementine应用宝典第2章数据挖掘可挖掘的知识类型.pdf

数据挖掘机器学习原理与SPSS Clementine应用宝典第4章数据选择.pdf

数据挖掘机器学习原理与SPSS Clementine应用宝典第16章数据挖掘建模共35页.ppt

数据挖掘机器学习原理与SPSS Clementine应用宝典第10章关联规则共65页.ppt

数据挖掘机器学习原理与SPSS Clementine应用宝典第19章 SPSS Clementine数据管理共87页.ppt

小白学数据挖掘与机器学习基于SPSS Modeler实现含全部数据及模型文件.rar

数据挖掘机器学习原理与SPSS Clementine应用宝典第1章数据挖掘概述.ppt

李飞飞自传我看见的世界 The World I see