前言
这几年机器学习这种从经验学习的软件技术重现光明。在计算机诞生的早期,机器学习的概念已经出
现,各种理论天马行空,限于计算成本而未能普及。随着计算设备的普及,日常生活中越来越多的机
器学习应用,可以说它的成功开始变得习以为常。新应用如雨后春笋一般出现,很多都从机器学习中
获得动力。
在这本书里,我们将看到一些机器学习的模型和算法。我们会介绍一些常用的机器学习任务和模型的
效果评估方法。而这些模型和算法都是通过十分流行的Python机器学习库scikit-learn来完成,里面有
许多机器学习的模型和算法,每个API都简单易用。
本书特点主要有:
内容通俗易懂。本书只需要基本的编程和数学知识
案例实用。本书的案例都很容易上手,读者可以调整后解决自己的问题。
本书内容简介
第
1
章,机器学习基础
(http://muxuezi.github.io/posts/1-the-fundamentals-of-machine-
learning.html),将机器学习定义成一种通过学习经验改善工作效果的程序研究与设计过程。其他章节
都以这个定义为基础,后面每一章里介绍的机器学习模型都是按照这个思路解决任务,评估效果。
第
2
章,线性回归
(http://muxuezi.github.io/posts/2-linear-regression.html),介绍线性回归模型,一
种解释变量和模型参数与连续的响应变量相关的模型。本章介绍成本函数的定义,通过最小二乘法求
解模型参数获得最优模型。
第
3
章,特征提取与处理
(http://muxuezi.github.io/posts/3-feature-extraction-and-
preprocessing.html),介绍了常见的机器学习对象如文本,图像与分类变量的特征提取与处理方法。
第
4
章,从线性回归到逻辑回归
(http://muxuezi.github.io/posts/4-from-linear-regression-to-logistic-
regression.html),介绍广义线性回归模型如何解决分类任务。将逻辑回归模型与特征提取技术结合起
来实现一个垃圾短信分类器。
第
5
章,决策树
——
非线性回归与分类
(http://muxuezi.github.io/posts/5-nonlinear-classification-
and-regression-with-decision-trees.html),介绍了一种回归和分类的非线性模型——决策树。用决
策树集成方法实现了一个网页广告图片屏蔽器。
第
6
章,
K-Means
聚类
(http://muxuezi.github.io/posts/6-clustering-with-k-means.html),介绍非监督
学习的K-Means聚类算法,并与逻辑回归组合起来实现一个照片分类器。
第
7
章,用
PCA
降维
(http://muxuezi.github.io/posts/7-dimensionality-reduction-with-pca.html),介
绍另一种非监督学习任务——降维。我们用主成分分析实现高维数据的可视化,建立一个脸部识别
器。