# tianyicup-education
“添翼杯”人工智能创新应用大赛-智慧教育赛道 TOP3
油菜花一朵:[@LogicJake](https://github.com/LogicJake) [@whoami-zy](https://github.com/whoami-zy) @油菜花
## 赛题背景
随着人工智能(AI)的发展,“AI+教育”“智慧课堂”等名词逐渐出现在大众视野,越来越多的学校将人工智能助手融入课堂,当下中国正逐步进入“智慧教育”时代。在传统课堂中,由于时间和精力的限制,老师和家长无法兼顾学生的学习状态和学业进展,不会关注大量对于学生能反应其真实问题和情况的数据。
智慧教育通过将传统教育行业的场景和当下最新的人工智能算法紧密结合,深度挖掘学生在各个知识点上的历史答题表现数据,最终预测学生在考试中的分数表现。
## 赛题描述
请参赛选手,利用比赛对应训练集提供的学生信息、考试知识点信息、考试总得分信息等建立模型,预测测试集中学生在指定考试中的成绩总分,预测目标如下:
* 初赛:利用初中最后一年的相关考试和考点信息,预测初中最后一学期倒数第二、第三次考试的成绩。
* 复赛:利用初中 4 年中的相关考试和考点信息,预测初中最后一学期最后一次考试的的成绩。
## 数据下载
[初赛数据下载(右键保存下载)](https://www.kesci.com/urls/740cd3de)
## 特征工程
### 基本特征
学生特征:
* 性别
课程特征:
* 课程类别
考试特征:
* 考试次序
* 考试知识点数量
* 考试知识点跨度
* 考试知识点所属段落数量
* 考试知识点所属段落跨度
* 考试知识点所属类目数量
* 考试知识点所属类目数量
* 考试总体难度(知识点占比×知识点难度)
* 考试知识点各难度占比
* 考试的知识点占比(pca降维到60维)
* 考试的知识点种类和段落占比(pca降维到60维)
* 知识点个数和考试难度拼接
### 相似考试得分
分别根据知识点占比,知识点种类占比,知识点段落占比,为每个考试找出最相似的3场考试。根据学生在这三场考试上的成绩,根据相似度加权平均求得这次考试的成绩。
### 基于分数的统计特征
分数是标签信息,直接利用全局信息统计会出现数据泄露,造成线上线下模型效果不一致。所以采用五折交叉统计,将历史考试成绩数据分为五折,每次用4折构造特征,给训练集中的另外1折。
将构造过程分为对象和统计方法两部分:
对象:
* 学生所有考试成绩
* 学生所有考试排名
* 学生考试成绩 / 本次考试平均分
* 学生在所有考试上表现出来的抗压能力
* 学生在某门课考试上表现出来的抗压能力
* 某门课程的所有考试成绩
* 学生在某门课程上的考试成绩
* 学生在某门课程上某次考试成绩 / 某次考试平均成绩
* 某性别学生在某门课程上所有考试成绩
统计方法:
* 最大值(max)
* 最小值(min)
* 平均值(mean)
* 标准差(std)
* 中值(median)
* 变异系数(cv)
### 时序特征
* 最近三次考试成绩 mean std
* 最近三次考试排名 mean std
* 最近三次考试成绩差值的平均
* 对最近三次考试成绩平均分做窗口为8的平均
* 对最近三次考试成绩平均分差值做窗口为3的平均
* 最近三次考试成绩
### "嫁接"学习
利用前三年数据构造部分特征,预测最后一年的考试成绩。利用全量数据构造的特征加上预测的最后一年的考试成绩预测最后一次考试成绩。
## 模型
五折交叉验证,lightgbm和xgboost各5个模型融合。
| 模型 | Public分数 |
|:---------:|:-----------:|
| xgboost | 7.289815178 |
| lightgbm | 7.288464145 |
| 融合 | 7.286831301 |
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等 人工智能大赛参赛作品,供参赛人员学习参考,含设计文档、源代码等
资源推荐
资源详情
资源评论
收起资源包目录
“添翼杯”人工智能创新应用大赛-智慧教育赛道 线上TOP3.zip (3个子文件)
tianyicup-education-master
嫁接.ipynb 40KB
README.md 4KB
复赛重置版.ipynb 39KB
共 3 条
- 1
资源评论
辣椒种子
- 粉丝: 3533
- 资源: 5721
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功