教育大数据背景下log数据挖掘与应用
一、log数据的概念与重要性
log数据作为教育大数据的一个子集,是学习系统中用户交互行为的记录。随着教育网络资源的快速发展,如慕课、在线课堂、精品课程资源的普及,log数据的采集变得更为便捷。这些数据在教育领域的应用,为我们提供了分析学习过程、学生行为和教育干预效果的新工具和新视角。
二、PISA中国区问题解决测验log数据的应用
PISA(Program for International Student Assessment,国际学生评估项目)2012年的中国区测验,全面采用了计算机化测试环境来评估15岁学生的全球问题解决能力,测验过程中所记录的log数据,成为研究学生问题解决过程的重要依据。本文以PISA中国区的log数据为研究对象,通过log数据挖掘的方法来分析学生在解决“交通”问题时的表现。
三、教育数据挖掘的方法与技术
教育数据挖掘过程通常包括原始数据预处理、数据挖掘、事后处理三个阶段。预处理阶段主要涉及数据的选择、筛选、格式转化和类型合并。数据挖掘阶段则采用聚类、关系挖掘等技术对数据进行分析。事后处理阶段则涉及对挖掘结果的解释与评估,以及基于结果提出的相关建议。本研究中主要使用了聚类和关系挖掘方法,来分析学生的行为模式、策略选择及问题解决能力。
四、log数据挖掘在问题解决过程中的应用
研究通过log数据挖掘发现,不同地区的学生在使用“有目的试误”策略的频率上存在显著差异。比如,上海学生在高百分位数上的解题时间和鼠标点击次数较低,表明他们更注重时间成本,可能更有效地使用了策略。而“有目的试误”策略在学生问题解决能力的体现中占有重要位置,这提示教育工作者和研究者可以通过log数据挖掘来识别和评估不同的问题解决策略和行为模式。
五、学生问题解决过程的分组
依据学生使用“有目的试误”策略的程度,可以将学生在问题解决过程中的表现划分为五个群组:最优组、有目的试误组、其他策略组、只顾玩乐组和功能障碍组。在这一分类中,台湾学生在“最优组”中表现最佳,而香港学生在“只顾玩乐组~功能障碍组”中所占比例最高。这样的分组有助于更细致地理解学生的学习风格和解决问题的能力。
六、log数据在教育决策中的应用
log数据对于分析问题解决过程、辨别问题解决群组、发展基于证据的教育决策等方面具有重要作用。它不仅帮助教育工作者和研究者捕捉学生问题解决的特点,还为后续教学干预提供了有效的证据。通过对log数据的深入分析,可以构建出更贴合学生实际问题解决过程的教学模式和学习活动。
七、研究的局限与展望
尽管本文展示了log数据挖掘在教育领域的巨大潜力,但研究也有其局限性。例如,log数据记录的仅为可量化的交互行为,对于学生的思考过程、情感态度等更深层次的学习情况则难以触及。未来的研究可以结合其他数据来源(如视频、问卷等),以获得更为全面的学生学习信息。
八、结论
log数据挖掘在教育大数据背景下的应用,为我们提供了一个全新的视角来观察和理解学生的学习行为和问题解决能力。通过挖掘PISA(2012)中国区问题解决测验中的log数据,我们不仅能够分析学生的答题模式和策略选择,还能够为教育决策提供科学依据,进而优化教学策略和学习活动设计。随着技术的进步和数据挖掘技术的不断发展,log数据在教育领域的应用将会越来越广泛,其价值也将日益凸显。