1
2020 年“泰迪杯”数据分析职业技能大赛
A
题
教育平台的线上课程智能推荐策略
一、
背景
近年来,随着互联网与通信技术的高速发展,学习资源的建设与共享呈现出
新的发展趋势,各种网课、慕课、直播课等层出不穷,各种在线教育平台和学习
应用纷纷涌现。尤其是 2020 年春季学期,受新冠疫情影响,在教育部“停课不
停学”的要求下,网络平台成为“互联网+教育”成果的重要展示阵地。因此,
如何根据教育平台的线上用户信息和学习信息,通过数据分析为教育平台和用户
提供精准的课程推荐服务就成为线上教育的热点问题。
本赛题提供了某教育平台近两年的运营数据,希望参赛者根据这些数据,为
平台制定综合的线上课程推荐策略,以便更好地服务线上用户。
二、
目标
1. 分析平台用户的活跃情况,计算用户的流失率。
2. 分析线上课程的受欢迎程度,构建课程智能推荐模型,为教育平台的线上
推荐服务提供策略。
三、
任务
附件是某教育平台 2018 年 9 月至 2020 年 6 月的线上课程运营数据,请根据
附件数据,自行选择分析工具完成以下任务,并撰写报告(报告的要求详见:
四、竞赛成果提交说明)。如使用“TipDM 大数据挖掘建模平台”实现,使用方
式详见附录二。
任务 1 数据预处理
任务
1.1
对照附录
1
,理解各字段的含义,进行缺失值、重复值等方面的必
评论0