先修课程: 高等数学、高等代数、概论论与数理统计
授课对象: 理科试验班
培养学生的数据思维,教学目标集中于两个方面:一个是理论方法的学习,即掌握数据分析的基本
课程目标: 思路、基本理论与基本方法;一个是实践应用能力培养,即面向实际应用中典型的行业需求,能够
设计并实现合理的解决方案。
“数据科学导论”是一门入门课程,同时也是“数据科学”课程群统领式的课程,把学生引进数据科学
的大门。它的目标有两个:一个是扩展学生在数据科学方面的视野培养兴趣,另一个是为学习后续
课程简介: 课程打下坚实的基础,培养数据科学家。 教学内容分为四大模块,分别是基础(base )模块、关
系数据/流数据处理(relational & stream)模块、文本数据处理和分析(text)模块、图数据处理
和分析(graph)模块。
1、掌握数据分析的基本思路、基本理论与基本方法。 2、熟悉数据分析相关平台和工具的使用。
3、加强动手实践,通过知识点案例和综合案例的学习以及 3 个大作业的完成,切实提高分析问
学习要求:
题、解决问题的能力。
教材: 1.覃雄派,陈跃国,杜小勇.《数据科学概论》.中国人民大学出版社. 2018.01参考教材:
推荐材料及
2.欧高炎,朱占星,董彬,鄂维南.《数据科学导引》.高教出版社. 2017.12 3.朝乐门.《数据科
阅读文献:
学》.清华大数据出版社.2016.08
平时考核(占总成绩比例%) :
期末考核(占总成绩比例%) :
期末考核内容:
60
期中考试(占平时成绩比例%) :
40 课堂作业(占平时成绩比例%) :
笔试 课堂表现(占平时成绩比例%) :
15
80
5
教
学
周
第
1
周
第
2
周
第
3
周
第
4
周
研究学习要求
章节名称 讲授内容及掌握程度
学习内容
数据科学概论,主要介绍数据科学的基本
概念、大数据及其价值、数据处理的全生
命周期,包括数据的采集和获取、数据预
处理/清洗和集成、数据管理、数据分析、
可视化和解释等
学习时间(小时)
数据科学概论
数据探索与 Python
Python 基础与常用工具(如 Jupyter
语言
notebook );数据探索与预处理与 Pandas
数据探索与 Python
Python 基础与常用工具(如 Jupyter
语言
notebook );数据探索与预处理与 Pandas
培养学生建立机器学习问题、方法、评价
的基本概念与能力,包括:分类
(KNN )、聚类(K-means )与回归
(linear regression),以及 Python 机器学
习实践(如 sklearn)
培养学生建立机器学习问题、方法、评价
的基本概念与能力,包括:分类
(KNN )、聚类(K-means )与回归
机器学习初步与实
践
第
5
周
机器学习初步与实
践