没有合适的资源?快使用搜索试试~ 我知道了~
1.一个故事说明什么是机器学习 2.机器学习的定义 3.机器学习的范围 4.机器学习的方法 5.机器学习的应用--大数据 6.机器学习的子类--深度学习 7.机
资源详情
资源评论
资源推荐
在 本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不
了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是 EasyPR
开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍 EasyPR 的内核。当
然,本文也面对一般读者,不会对阅读有相关的前提要求。
在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于
要阅读完这篇非常长的文章呢?
我并不直接回答这个问题前。相反,我想请大家看两张图,下图是图一:
图 1 机器学习界的执牛耳者与互联网界的大鳄的联姻
这幅图上上的三人是当今机器学习界的执牛耳者。中间的是 Geoffrey Hinton, 加
拿大多伦多大学的教授,如今被聘为“Google 大脑”的负责人。右边的是 Yann LeCun,
纽约大学教授,如今是Facebook人工智能实验室的主任。而左边的大家都很熟悉,Andrew
Ng,中文名吴恩达,斯坦福大学副教授,如今也是“百度大脑”的负责人与百度首席科
学家。这三位都是目前业界炙手可热的大牛,被互联网界大鳄求贤若渴的聘 请,足见
他们的重要性。而他们的研究方向,则全部都是机器学习的子类--深度学习。
下图是图二:
图 2 语音助手产品
这幅图上描述的是什么?Windows Phone 上的语音助手 Cortana,名字来源于《光
环》中士官长的助手。相比其他竞争对手,微软很迟才推出这个服务。Cortana 背后的
核心技术是 什么,为什么它能够听懂人的语音?事实上,这个技术正是机器学习。机
器学习是所有语音助手产品(包括 Apple 的 siri 与 Google 的 Now)能够跟 人交互的关键
技术。
通过上面两图,我相信大家可以看出机器学习似乎是一个很重要的,有很多未知特
性的技术。学习它似乎是一件有趣的任务。实际上,学习机器学习不仅可以帮助我们了
解互联网界最新的趋势,同时也可以知道伴随我们的便利服务的实现技术。
机器学习是什么,为什么它能有这么大的魔力,这些问题正是本文要回答的。同时,
本文叫做“从机器学习谈起”,因此会以漫谈的形式介绍跟机器学习相关的所有内容,
包括学科(如数据挖掘、计算机视觉等),算法(神经网络,svm)等等。本文的主要目录
如下:
1.一个故事说明什么是机器学习
2.机器学习的定义
3.机器学习的范围
4.机器学习的方法
5.机器学习的应用--大数据
6.机器学习的子类--深度学习
7.机器学习的父类--人工智能
8.机器学习的思考--计算机的潜意识
9.总结
10.后记
1.一个故事说明什么是机器学习
机器学习这个词是让人疑惑的,首先它是英文名称 Machine Learning(简称 ML)的
直译,在计算界 Machine 一般指计算机。这个名字使用了拟人的手法,说明了这门技术
是让机器“学习”的技术。但是计算机是死的,怎么可能像人类一样“学习”呢?
传统上如果我们想让计算机工作,我们给它一串指令,然后它遵照这个指令一步
步执行下去。有因有果,非常明确。但这样的方式在机器学习中行不通。机器学习 根
本不接受你输入的指令,相反,它接受你输入的数据! 也就是说,机器学习是一种让计
算机利用数据而不是指令来进行各种工作的方法。这听起来非常不可思议,但结果上却
是非常可行的。“统计”思想将在你学习“机 器学习”相关理念时无时无刻不伴随,
相关而不是因果的概念将是支撑机器学习能够工作的核心概念。你会颠覆对你以前所有
程序中建立的因果无处不在的根本理 念。
下面我通过一个故事来简单地阐明什么是机器学习。这个故事比较适合用在知乎上
作为一个概念的阐明。在这里,这个故事没有展开,但 相关内容与核心是存在的。如
果你想简单的了解一下什么是机器学习,那么看完这个故事就足够了。如果你想了解机
器学习的更多知识以及与它关联紧密的当代技 术,那么请你继续往下看,后面有更多
的丰富的内容。
这个例子来源于我真实的生活经验,我在思考这个问题的时候突然发现它的过程可
以被扩充化为一个完整的机器学习的过程,因此我决定使用这个例子作为所有介绍的开
始。这个故事称为“等人问题”。
我相信大家都有跟别人相约,然后等人的经历。现实中不是每个人都那么守时的,
于是当你碰到一些爱迟到的人,你的时间不可避免的要浪费。我就碰到过这样的一个例
子。
对我的一个朋友小 Y 而言,他就不是那么守时,最常见的表现是他经常迟到。当有
一次我跟他约好 3 点钟在某个麦当劳见面时,在我出门的那一刻我突然想到一个问题:
我现在出发合适么?我会不会又到了地点后,花上 30 分钟去等他?我决定采取一个策
略解决这个问题。
要想解决这个问题,有好几种方法。第一种方法是采用知识:我搜寻能够解决这
个问题的知识。但很遗憾,没有人会把如何等人这个问题作为知识传授,因此我不 可
能找到已有的知识能够解决这个问题。第二种方法是问他人:我去询问他人获得解决这
个问题的能力。但是同样的,这个问题没有人能够解答,因为可能没人碰上 跟我一样
的情况。第三种方法是准则法:我问自己的内心,我有否设立过什么准则去面对这个问
题?例如,无论别人如何,我都会守时到达。但我不是个死板的人, 我没有设立过这
样的规则。
事实上,我相信有种方法比以上三种都合适。我把过往跟小 Y 相约的经历在脑海中
重现一下,看看跟他相约的次数 中,迟到占了多大的比例。而我利用这来预测他这次
迟到的可能性。如果这个值超出了我心里的某个界限,那我选择等一会再出发。假设我
跟小 Y 约过 5 次,他迟到 的次数是 1 次,那么他按时到的比例为 80%,我心中的阈值为
70%,我认为这次小 Y 应该不会迟到,因此我按时出门。如果小 Y 在 5 次迟到的次数中
占了 4 次, 也就是他按时到达的比例为 20%,由于这个值低于我的阈值,因此我选择推
迟出门的时间。这个方法从它的利用层面来看,又称为经验法。在经验法的思考过程 中,
我事实上利用了以往所有相约的数据。因此也可以称之为依据数据做的判断。
依据数据所做的判断跟机器学习的思想根本上是一致的。
刚才的思考过程我只考虑“频次”这种属性。在真实的机器学习中,这可能都不
算是一个应用。一般的机器学习模型至少考虑两个量:一个是因变量,也就是我们 希
望预测的结果,在这个例子里就是小 Y 迟到与否的判断。另一个是自变量,也就是用来
预测小 Y 是否迟到的量。假设我把时间作为自变量,譬如我发现小 Y 所有迟 到的日子
基本都是星期五,而在非星期五情况下他基本不迟到。于是我可以建立一个模型,来模
拟小 Y 迟到与否跟日子是否是星期五的概率。见下图:
图 3 决策树模型
这样的图就是一个最简单的机器学习模型,称之为决策树。
当我们考虑的自变量只有一个时,情况较为简单。如果把我们的自变量再增加一个。
例如小 Y 迟到的部分情况时是在他开车过来的时候(你可以理解为他开车水平较臭,或
者路较堵)。于是我可以关联考虑这些信息。建立一个更复杂的模型,这个模型包含两
个自变量与一个因变量。
再更复杂一点,小 Y 的迟到跟天气也有一定的原因,例如下雨的时候,这时候我需
要考虑三个自变量。
如果我希望能够预测小 Y 迟到的具体时间,我可以把他每次迟到的时间跟雨量的
大小以及前面考虑的自变量统一建立一个模型。于是我的模型可以预测值,例如他 大
概会迟到几分钟。这样可以帮助我更好的规划我出门的时间。在这样的情况下,决策树
就无法很好地支撑了,因为决策树只能预测离散值。我们可以用节 2 所介绍 的线型回
归方法建立这个模型。
如果我把这些建立模型的过程交给电脑。比如把所有的自变量和因变量输入,然后
让计算机帮我生成一个模型,同时让计算机根据我当前的情况,给出我是否需要迟出门,
需要迟几分钟的建议。那么计算机执行这些辅助决策的过程就是机器学习的过程。
机器学习方法是计算机利用已有的数据(经验),得出了某种模型(迟到的规律),并
利用此模型预测未来(是否迟到)的一种方法。
通过上面的分析,可以看出机器学习与人类思考的经验过程是类似的,不过它能
考虑更多的情况,执行更加复杂的计算。事实上,机器学习的一个主要目的就是把 人
类思考归纳经验的过程转化为计算机通过对数据的处理计算得出模型的过程。经过计算
机得出的模型能够以近似于人的方式解决很多灵活复杂的问题。
下面,我会开始对机器学习的正式介绍,包括定义、范围,方法、应用等等,都有
所包含。
2.机器学习的定义
从广义上来说,机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无
法完成的功能的方法。但从实践的意义上来说,机器学习是一种通过利用数据,训练出
模型,然后使用模型预测的一种方法。
剩余27页未读,继续阅读
爱吃番茄great
- 粉丝: 19
- 资源: 298
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0