第二章:统计学习的基本概念
1、统计学习是什么
2、为什么要估计函数 f
3、参数和非参数方法
4、预测精确性和模型解释性的 trade-off
5、有监督和无监督学习
6、分类和回归
7、如何衡量模型的精确程度(分类模型和回归模型)
8、偏差和方差的 trade-off
9、贝叶斯分类器和 KNN 算法
第三章:线性回归模型
1、线性模型的估计、检验、预测问题
2、特殊情形下的调整,非线性数据、残差相关、非常数残差、异常值、高杠杆点、共线性
第四章:分类模型
1、逻辑回归的模型假定、参数估计和决策准则
2、LDA 和 QDA 的模型假定、参数估计和决策准则
第五章:重抽样方法
1、验证集、留一交叉验证、K 折交叉验证的实施过程
2、Bootstrap 的用途和具体的实施过程
第六章:线性模型选择和规则化方法
1、为什么要模型选择(预测精确性和模型解释性)
2、子集选择、逐步回归的计算步骤
3、岭回归和 LASSO 回归的计算函数和算法以及差异
4、主成份回归和偏最小二乘的计算过程
第七章:非线性模型
1、多项式回归、阶段函数的含义
2、分段多项式函数和回归样条的承接
3、局部回归在线性模型中的应用
第八章:树形方法
1、分类回归树对应的最优化问题和计算步骤
2、bagging 和 random forest 方法的实施步骤和差异
3、out-of-bag 误差估计和变量重要性的计算方法
第九章:支持向量机
1、超平面的含义
2、最大边缘分类器的基本思想和优化问题
3、支持向量分类器的出发点和对应的优化问题
4、核函数的作用
5、为什么高维投射可以解决线性不可分的问题
第十章:无监督方法
1、PCA 方法的原理
2、层次聚类的计算过程
3、K 均值聚类的优化问题和计算方法
4、DBSCAN 的主要思想
评论0