没有合适的资源?快使用搜索试试~ 我知道了~
毕业设计原文--本科毕业设计
4星 · 超过85%的资源 需积分: 10 69 下载量 39 浏览量
2008-11-14
08:49:21
上传
评论
收藏 207KB DOC 举报
温馨提示
试读
13页
数据挖掘在教师因素对学生成绩影响分析中的应用研究,是本科生的毕业设计,十分好用哦,绝对真实版毕业论文。
资源推荐
资源详情
资源评论
题 目 数据挖掘在教师因素对学生
成绩影响分析中的应用研究
系 (院) 计算机科学技术系
专 业 计算机科学与技术
班 级 04本7
学生姓名 姚同学
学 号 2004071025
指导教师 刘老师
职 称 讲师
2008年5月19日
数据挖掘在教师因素对学生成绩影响分析中的应用研究
摘 要
数据挖掘技术是信息技术研究的热点问题之一。目前数据挖掘技术在商业、金融业以及企业的
生产、市场营销等方面都得到了广泛的应用,而在教育领域的应用相对较少,随着高校招生规
模的扩展,在校生人数越来越多,学生成绩分布越来越复杂,除了传统的学生成绩分析得到的
一些结论外,还有一些不易察觉的信息隐含其中,因而把基于数据库的数据挖掘技术引入到学
生成绩分析中,可以找到影响学生成绩的真实原因,有利于有针对性地提高教学质量。
本文在对数据挖掘知识透彻理解的基础上,首先,介绍了数据挖掘的基本理论;其次,阐述了
数据挖掘中关联规则的基本算法;最后,通过对数据挖掘中的关联规则算法进行深入研究,对
算法进行改进,并把改进的算法应用于所建立的教师档案_学生平均成绩数据库中。通过对教
师档案_学生平均成绩数据库进行深入的分析和合理的归纳,可以挖掘出大量的、有价值的数
据信息,比如不同性别、不同年龄、不同学位、不同职称的教师在不同课程中的教学效果等等
这些分析必将对教学工作的开展与改进有着重要的指导意义。
关键词:数据挖掘 关联规则 教师因素 学生成绩分析
R e s e a r c h o n t h e A p p l i c a t i o n o f D a t a M i n i n g i n t h e A n a l y s i s o f T e a c h e r F a c t o r s I m p a c t i n g o n
Student’s Achievement
Abstract
T h e t e c h n o l o g y o f d a t a m i n i n g i s o n e o f t h e h o t i s s u e s i n t h e IT f i e l d . N o w a d a y s d a t a m i n i n g
technology is widely used in business, finance,producing and marketing, but less in education field.
With the increase of enrollment in universities, there are more and more students entering campus,
and that makes it more and more complex in the distributing of students’ records. Besides the some
c o n c l u s i o n s f r o m t r a d i t i o n a l r e c o r d a n a l y s i s , a l o t o f p o t e n t i a l i n f o r m a t i o n c a n n o t b e f o u n d e d .
Importing the data mining technology to students’ record analyzing, is more convenient to find the
actual reason of affecting students’ records and improve the teaching quality.
Thi s pape r is b a s ed o n goo d comp r ehen s i on o n da t a min i n g kno w ledg e . Fi r s t ly, it i n trod u c es t h e
b a s i c t h e o r y o f t h e m . S e c o n d l y , i t e x p o u n d s t h e b a s i c a r i t h m e t i c o f a s s o c i a t i o n r u l e m i n i n g .
Lastly, through deep research on the arithmetic of association rule mining, the paper improved it and
p u t i t i n t o T e a c h e r s f i l e - t h e a v e r a g e s t u d e n t a c h i e v e m e n t d a t a b a s e . I n
conclusion, based on deeply analysis and reasonable conclusion, plenty of valuable information is
found. For example, different gender and age groups and different places, different titles in different
c o u r s e s f o r t e a c h e r s i n t h e t e a c h i n g e f f e c t , e t c . A l l t h e s e a n a l y s i s w i l l h a v e g r e a t e f f e c t s o n t h e
performing and improving of teaching.
Key Words:Data mining Association rule Teachers factors Analysis of student achievement 一、
绪论
(一) 课题背景及选题意义
数据挖掘技术在商业、金融业以及企业的生产、市场营销等方面都得到了广泛的应用,而在教
育领域的应用相对较少,高校中对学生信息、成绩等数据的处理一般还停留在简单的数据的备
份和查询阶段。近年来随着高校的不断扩招,学生人数大幅度增加,越来越多的教育数据堆积
在服务器里。大量信息在给人们带来方便的同时也带来了信息的辨识、信息的安全、信息形式
的一致性等问题。人们开始考虑:如何才能不被信息淹没,避免“数据丰富,但信息贫乏”的现
象。在如此大的数据海洋中,要提取有用的信息,传统的技术和方法难以解决这个问题,我们
如何充分的利用这些资源,如何从这些海量的教育数据中,挖掘出有价值的信息,对教育质量
进行评估,是当前教育信息化建设中一个非常迫切的问题。
数据挖掘技术是当前数据库研究领域里的一个热门技术,它正广泛的应用于银行、税务、金融
教育等领域[1]。数据挖掘技术在教育信息化中的应用空间很广,比如教师因素对学生成绩影
响等。教师因素对学生成绩的影响的应用研究是教育工作者的重要职责之一。评定教师教学情
况,既对教师起到信息反馈和激发改进方法的作用,又是检查课程计划、教学程序以至教学目
的的手段,也是考查教师不同学科的教学能力,便于因材施教的途径。
本文的工作就是基于这样一个背景下展开的。数据挖掘技术可对现积累的大量的学生成绩数据
进行整理后,建立起一个以学生成绩的学习评价数据为实体的多维数据立方体模型,找出影响
学生发展的教师因素,从而为个性教学策略提供数据依据,便于在班级排课时,注意一个班级
中配备教师的年龄、职称、学位、性别等的合理分配,促进数据挖掘的功能在教育行业中的应
用。
(二) 数据挖掘的国内外研究现状
随着信息化的飞速发展,信息量的超指数上升使传统数据库的检索查询机制和统计学分析方法
己远远不能满足现实的需要。许多数据来不及分析就过时了,也有很多数据因其数据量极大而
难以分析数据间的关系。在这样的背景下,数据挖掘技术便应运而生。数据库的产生和发展为
数据挖掘技术提出了新的要求和挑战。数据挖掘的提出使人们能力认识数据的真正价值,即蕴
藏在数据中的信息和知识。数据分析己经和数据库的研究结合起来。为高级的决策支持服务是
数据挖掘技术的最终目的,因此数据挖掘技术的研究,自然成为信息科学学术界的热点问题。
目前,数据挖掘技术在教育层面上的应用己经开始,但并不广泛。浙江大学使用关联规则发现
技术对高校的人事信息库进行挖掘,试图找到影响学生发展的教师因素,发现如何评价一个学
科,以及影响学科发展的各个要素之间的关系。另外,曲阜师范大学体育系与上海阂行体委就
体育人才的选拔探讨了数据挖掘的可行性。在每年对中小学生的体质调查中,积累了大量的数
据,利用数据挖掘技术,他们试图从数据中深入寻找各种因素的相互联系,发现一些随诸因素
动态变化而产生的新的指导学校体育科研和教学训练的规律,进而发现运动人才。
关联规则挖掘(Association Rule Mining)是发现大量数据中项集之间有趣的关联或相关联系;关
联规则挖掘是数据挖掘研究的一个重要分支;关联规则是数据挖掘的众多知识类型中最为典型
的一种。教学过程中,影响教学质量的因素是发展的、动态的,不是恒定不变的,但在长期的
教学过程中又有相对稳定的因素。比如教学计划的安排、同一个教师的教学情况、同一个学生
的学习情况,这些都可以反映在平时的教与学的过程中。而关联规则形式简洁、易于解释和理
解,可以有效地捕捉数据间的重要关系,从大型数据库中挖掘关联规则问题己成为数据挖掘中
最成熟、最重要、最活跃的研究内容。因此可以考虑将关联规则应用于教师因素对学生成绩影
响分析的应用研究中。
采用数据挖掘中的关联规则算法对于教师因素对学生成绩影响分析中的应用研究正是目前面临
的一个值得研究的新课题。
(三) 论文结构
一、绪论。主要介绍课题背景及选题意义,综述了数据挖掘的国内外研究现状。
二、数据挖掘的相关理论。主要介绍数据挖掘的定义、功能、对象、过程。
三、关联规则。对关联规则进行概述和算法介绍。
四、关联规则在教师因素对学生成绩影响分析中的应用。利用关联规则算法对教师因素对学生
成绩影响进行数据挖掘。
五、总结与展望。阐述了本人在论文研究阶段的工作、论文的创新点、并对数据挖掘技术在高
校教学管理中的进一步研究进行分析和展望。
二、数据挖掘的相关理论
(一) 数据挖掘的定义
数据挖掘的一种比较公认的定义是W.J.Frawley、Piatetsky-Shaprio 等人提出的:数据挖掘,就
是从数据中获取正确、新颖、有潜在应用价值和最终可理解模式的非平凡的过程[2]。下面对
一些概念作详细的解释:
数据:是一组事实F的集合(如关系数据库中的记录),它是描述事物有关方面的信息,一般来
说这些数据都是准确无误的[3]。
模式:是一个用语言L来表示的一个表达式E,它可以用来描述数据集F的某个集FE。只有当表
达式E比列举的所有FE中元素的描述方法更为简单时,才可以称之为模式。
过程:数据挖掘是一个多阶段的处理过程,它涉及数据预处理、模式提取、知识评价及过程优
化,该过程具有迭代的性质;而“非平凡的”是指其要有一定程度的智能性和自动性。
有效性:是指发现的模式对于新的数据仍保持有一定的可信度,否则数据挖掘就毫无疑义。
新颖性:经过数据挖掘提取出的模式必须是新的。
潜在有用性:是指发现的知识将来有实际效用,如用于决策支持系统里可以提高经济效益。
可理解性:数据挖掘的一个目标就是将数据中隐含的模式能被用户理解,目前它主要表现在简
洁性上。
其中,有效性、新颖性、潜在有用性和可理解性综合在一起可称之为兴趣性【4】。
(二) 数据挖掘的功能
数据挖掘功能有六项:关联分析、时序模式、聚类、分类、偏差检测以及预测【5】。
(1)关联分析:关联分析是从数据库中发现知识的一类重要方法。若两个或多个数据项的取
值之间重复出现且概率很高时,它就存在某种关联,可以建立起这些数据项的关联规则。在大
型数据库中,这种关联规则是很多的,需要进行筛选,一般用“支持度”和“可信度”两个阈值来
淘汰那些无用的关联规则。“支持度”表示该规则所代表的事例(元组)占全部事例(元组)的百分比
“可信度”表示该规则所代表事例占满足前提条件事例的百分比。
(2)时序模式:通过时间序列搜索出重复发生概率较高的模式。这里强调时间序列的影响。
在时序模式中,需要找出在某个最小时间内出现比率一直高于某一最小百分比(阈值)的规则。
这些规则会随着形式的变化做适当的调整。时序模式中,一个有重要影响的方法是“相似时
序”。用“相似时序”的方法,要按时间顺序查看时间事件数据库,从中找出另一个或多个相似的
时序事件。
剩余12页未读,继续阅读
资源评论
- wellerp52014-07-09内容不很全面,还算可以吧
tiantangsinian8
- 粉丝: 19
- 资源: 60
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功