![](https://csdnimg.cn/release/download_crawler_static/86325113/bg1.jpg)
第九周练习题
第一题:
请编写代码:
1、构建一个数据模型,由电信科专业 20 级五个自然班,每班人数
45,数据包括学生的“学号”、“姓名”、‘ 班级’以及“高等数学”,
“英语”、“Python”、“ 普通物理”、“ 科学导论”五门课程的成绩,成
绩数据的产生要符合正太分布,“学号”由 10 位数字组成,前六位为
“202021”,最后两位为班级学生的序号(01-45),中间两位表示“班
号”(01-03),分别使用随机函数库(np.random, faker)创建 225 个学生
的数据。
2、将以上数据以学号作为行索引,各列数据的次序调整为班级、姓
名、高等数学,英语、Python、普通物理、科学导论,再分别保存为.csv
和.xlsx 两个数据文件。
3、根据以上数据,分别求解输出每门课程的最高分、最低分和平均
分。
3、根据以上数据,按班组分组,统计处理,求解分别输出
(1)电信科 20-1 班高等数学的最高、最低分;
(2) 电信科 20-2 班英语的平均分和方差;
(3) 电信科 20-3 班 python 的最高、最低分、平均分和方差;
(4) 电信科 20-4 班普通物理的 25%、50%、75%;
(5) 电信科 20-5 班学号为 2020210510 学生的各科成绩。
4、使用切片处理分别生成一个电信科 20-3 和电信科 20-4 班学生的
DataFrame 数据集,分别保存为.xlsx 类型文件,再以电信科 20-3 班的
姓名和班级数据与电信科 20-4 班的五门课成绩组成一个 DataFrame
数据集,也保存为.xlsx 文件。
*5、根据电信科 20-3 班学生数据集,试使用 matplotlib 库作出该班高
等数据课程成绩的直方图和英语课成绩的箱式图(此小题为提高题)。
评论0