
一、 基本概念
(1)机器学习一般包括:监督学习、无监督学习、强化学习。有时还包括半监督学习、
主动学习。
监督学习是指从标注数据中学习预测模型的机器学习问题。监督学习的本质是学
习输入到输出的映射的统计规律。
无监督学习是指从无标注数据中学习预测模型的机器学习问题。无监督学习的本
质是学习数据中的统计规律或潜在结构。
半监督学习(semi-supervised learning)是指利用标注数据和未标注数据学习
预测模型的机器学习问题。半监督学习旨在利用未标注数据中的信息,辅助标注数据,
进行监督学习,以较低的成本达到较好的学习效果。
主动学习(active learning)是指机器不断主动给出实例让教师进行标注,然
后利用标注数据学习预测模型的机器学习问题。主动学习的目标是找出对学习
最有帮助的实例让教师标注,以较小的标注代价达到较好的学习效果。
(2)按模型分类:概率模型与非概率模型,线性模型与非线性模型,参数化模型与非参
数化模型。
按算法分类:在线学习,批量学习 按技巧分类:贝叶斯学习,核方法
(3)机器学习方法三要素:模型,策略,算法.
损失函数与风险函数机器学习损失函数(Loss Function)或代价函数(Cost
Function)是一个非负实数函数,用来量化模型预测和真实标签之间的差异。即通过
最小化损失函数求解和评估模型。损失函数值越小,模型的性能越好。不同的模型用
的损失函数一般也不一样。