大学生在线学习体验的聚类分析研究.docx
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
大学生在线学习体验的聚类分析研究 本研究旨在通过爬虫软件和Python编程对收集到的微博平台上关于大学生网课的评论进行分词、词频统计和聚类分析,了解疫情背景下大学生的在线学习体验。研究采用质性研究方法,以微博文本数据作为数据来源,以学生为中心,运用网络爬虫搜集微博中高校大学生关于网课体验的评论与话题,通过文本数据聚类分析深入挖掘文本数据,呈现出特殊时期学生在课前、课中、课后真实的学习体验状况,分析影响学生体验的关键因素。 研究方法和工具 本研究采集微博数据的工具是网络爬虫,能够根据目标需求爬取相关网页上的信息。网络爬虫抓取的微博数据来源分为三类:第一类是全国2688所高校的微博主页搜索与网课相关的博文,搜集每条博文下的相关评论;第二类是热点话题如“大学生网课”“大学生网课日常”“当代大学生网课现状”等的相关评论;第三类是来自于各教学平台使用评论,使用的平台有钉钉、中国大学MOOC平台、QQ直播、腾讯会议、腾讯课堂、ZOOM、雨课堂、学习通、智慧树等。 数据分析 数据分析步骤包括数据去重、特征提取、聚类过程、聚类结果评估五步骤。在数据去重步骤中,将12058条博文评论内容的文本进行数据“清洗”,去除话题评论中所含有的共同话题词,如#大学生网课#、#大学生网课日常#等,避免这些主题词的词语重复计数到关键词的词频中而影响后续的分词和词频的统计工作;再剔除评论中出现的英文字母或异常词及无效文本评论。然后,将清洗后的数据放入Python程序的词云生成器中,先对文本数据中的所有词频进行词频统计,之后提取词频数排行前100的词语列表。 在聚类分析步骤中,将文本数据通过上述步骤转化成了0-1值的数据矩阵,将上述词频矩阵导入SPSS进行系统聚类分析。系统聚类分析选择聚类效果较好的组内联结法,此法采用简单匹配系数度量评论之间的相似性。简单匹配系数是当两条评论在关键词上的数值相同时出现的频率,频率越高说明两条评论越相似。经过系统聚类后的谱系如图2所示,可以看出,根据目前采集到的文本数据,大学生网课评论的文本可分为7类,选择距离阙值为22.5。 研究结果 根据研究结果,疫情背景下大学生的在线学习体验存在一定的问题。课前存在硬件设施、网络环境和学校支持不到位的情况;课中的问题主要集中于教学平台不统一,授课现场组织不到位,学生学习状态不在线;课后的作业任务重,学生虽然能够接受在线教学这种模式,但更期待能返校上课。 本研究的贡献 本研究的贡献在于:(1)采集微博数据的方法,能够更好地反映学生的真实感受;(2)聚类分析方法,能够更好地挖掘文本数据,呈现出学生的学习体验状况;(3)研究结果,能够为在线教学的开展提供相关参考。 本研究的意义 本研究的意义在于:(1)为在线教学的开展提供相关参考,帮助教育工作者更好地理解学生的需求和期望;(2)为教育研究提供了一种新的研究方法,能够更好地挖掘文本数据,呈现出学生的学习体验状况;(3)为教育实践提供了一种新的评估方法,能够更好地评估在线教学的效果。
剩余11页未读,继续阅读
- 粉丝: 6746
- 资源: 3万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助