.. -
机器学习是怎样的学科:致力于研究如何通过计算的手段,利用经历来改善系统自身的性
能。
机器学习主要分为两大类:监视学习、非监视学、强化学习〔〕、半监视学习。
机器学习所要研究的主要容是关于计算机在从数据中产生“模型〞的算法,即“学习算法〞
〔有了学习算法,我们把经历提供应它,他就能基于这些数据产生模型〕。
学习的特点:数据驱动,以方法为中心,概率统计优化为根底。
从数据中学得模型的过程称为“学习〞或“训练〞,这个过程通过执行某个学习算法来完成
训练过程中使用的数据称为“训练数据〞,每一个样本称为“训练样本〞,训练样本组成的
集合称为“训练集〞。
三要素:模型、策略、算法。
学得模型后,使用其进展预测得过程称为“测试〞。被测样本称为“测试样本〞。
机器学习的目标是使学得的模型能很好地适用于“新样本〞。独立同分布
学得模型适用于新样本的能力,称为“泛化〞能力。具有强泛化能力的模型能很好地适用于
整个样本空间。
奥卡姆剃刀〞原那么,是一种常用地、自然科学研究中最根底地原那么,即“诺有多个假
设与观察一致,那么选最简单地那个〞。〔采用这个原那么,那么所描绘地曲线更平滑,
更简单〕。
世纪 年代 年代初,人工智能处于“推理期〞。
世纪 年代中期开场,人工智能进入“知识期〞。
世纪 年代:被研究最多的应用最广的是“从样本中学习〞,其中的两个主流技术:符
号主义学习〔决策树,:归纳逻辑程序设计〕,基于神经网络的连接主义学习
世纪 年代中期:统计学习:代表性技术,支持向量机
世纪以来,连接主义学习“深度学习〞即很多层的神经网络
年夏,美国卡耐基梅隆大学举办了第一届机器学习研讨会〔〕。
同年策略分析与信息系统连出三期机器学习专辑。
年,第一本机器学习专业期刊 创刊。
年,人工智能领域地权威期刊 出版机器学习专辑。
年,卡耐基梅隆大学宣告成立世界上第一个“机器学习系〞。
经历误差:学习器在训练集上的误差称为“训练误差〞或“经历误差〞。
泛化误差:在新样本上的误差称为“泛化误差〞。
测试误差〞作为泛化误差的近似。
. . word.zl-