人工智能(第2版)
作者:[美]史蒂芬·卢奇(Stephen Lucci),丹尼·科佩克(Danny Kopec)
出版社:人民邮电出版社
ISBN:9787115488435
VIP会员免费
(仅需0.8元/天)
¥ 69.12
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
《终极算法:机器学习和人工智能如何重塑世界》高清完整PDF版 评分:
机器学习已经快成为一种“刻奇”了,之所以这么说,不只是因为其在我们生活中的各个领域内都迁移默会的塑形着我们的生活与认知,更因为有太多的人对机器学习大数据一窍不通,却仍随着潮流,不得不在自己的PPT上加上大数据,仿佛这是一道魔咒,而《The master algorithm》 这本书,则是解码这道魔咒的明镜。这本书中,没有公式与代码,有的只是对机器学习中的算法本质一针见血的点破,有的只是依据这些算法而编出的日常生活中的故事,是对机器学习中核心算法的概念化的模型。一言以概之,这是一本所有有高中数学水平且无计算机背景的读者都能够读懂的科普书。如果你不想对控制着我们衣食住行方方面面的机器学习算法一无所知,那么这本书是你必读的书。目前该书没有中文版。 下面的话,是针对那些多少有一些专业的背景读者。这些读者看了这本书,可以跳着看,透过作者的行文脉络,机器学习的从业者可以看出他们常用的算法隐藏在数学背后的逻辑引擎。而书的名字,则显示着作者试图在机器学习的各个流派间进行整合,最终提出机器学习里的“牛顿三定律”的理想。作者在这本书里,介绍了当前常用的算法的发展历程,这些算法包括决策树,遗传算法,神经网络,朴素贝叶斯及贝叶斯网络,隐式马尔可夫链,K最近邻及支持向量机,作者还介绍了无监督学习的算法。在介绍算法时,作者还介绍了机器学习里最大的两个阻碍,过拟合及维度灾难。
上传时间:2017-01 大小:14.16MB
- 41KB
人工智能基础算法.pdf
2021-10-19人工智能基础算法.pdf
- 146KB
人工智能的常用十种算法.pdf
2023-02-27⼈⼯智能的常⽤⼗种算法 根据⼀些 feature 进⾏分类,每个节点提⼀个问题,通过判断,将数据分为两类,再继续提问。这些问题是根据已有数据学习出来的,再投 ⼊新数据的时候,就可以根据这棵树上的问题,将数据划分到合适的叶⼦上。 如果你觉得这篇⽂章看起来稍微还有些吃⼒,或者想要更系统地学习⼈⼯智能,那么推荐你去看床长⼈⼯智能教程。⾮常棒的⼤神之作,教 程不仅通俗易懂,⽽且很风趣幽默。点击可以查看教程。 2. 随机森林 随机森林 在源数据中随机选取数据,组成⼏个⼦集 S 矩阵是源数据,有 1-N 条数据,A B C 是feature,最后⼀列C是类别 由 S 随机⽣成 M 个⼦矩阵 这 M 个⼦集得到 M 个决策树 将新数据投⼊到这 M 个树中,得到 M 个分类结果,计数看预测成哪⼀类的数⽬最多,就将此类别作为最后的预测结果 3. 逻辑回归 逻辑回归 当预测⽬标是概率这样的,值域需要满⾜⼤于等于0,⼩于等于1的,这个时候单纯的线性模型是做不到的,因为在定义域不在某个范围之 内时,值域也超出了规定区间。 所以此时需要这样的形状的模型会⽐较好 那么怎么得到这样的模型呢? 这个模型需要满⾜两个条件 ⼤于等于0,⼩于等于1 ⼤于等于0 的模型可以选择 绝对值,平⽅值,这⾥⽤ 指数函数,⼀定⼤于0 ⼩于等于1 ⽤除法,分⼦是⾃⼰,分母是⾃⾝加上1,那⼀定是⼩于1的了 再做⼀下变形,就得到了 logistic regression 模型 1. 决策树 决策树 通过源数据计算可以得到相应的系数了 最后得到 logistic 的图形 4. SVM support vector machine 要将两类分开,想要得到⼀个超平⾯,最优的超平⾯是到两类的 margin 达到最⼤,margin就是超平⾯与离它最近⼀点的距离,如下 图,Z2>Z1,所以绿⾊的超平⾯⽐较好 将这个超平⾯表⽰成⼀个线性⽅程,在线上⽅的⼀类,都⼤于等于1,另⼀类⼩于等于-1 点到⾯的距离根据图中的公式计算 所以得到 total margin 的表达式如下,⽬标是最⼤化这个 margin,就需要最⼩化分母,于是变成了⼀个优化问题 举个栗⼦,三个点,找到最优的超平⾯,定义了 weight vector=(2,3)-(1,1) 得到 weight vector 为(a,2a),将两个点代⼊⽅程,代⼊(2,3)另其值=1,代⼊(1,1)另其值=-1,求解出 a 和 截矩 w0 的 值,进⽽得到超平⾯的表达式。 a 求出来后,代⼊(a,2a)得到的就是 support vector a 和 w0 代⼊超平⾯的⽅程就是 support vector machine 5. 朴素贝叶斯 朴素贝叶斯 举个在 NLP 的应⽤ 给⼀段⽂字,返回情感分类,这段⽂字的态度是positive,还是negative 为了解决这个问题,可以只看其中的⼀些单词 这段⽂字,将仅由⼀些单词和它们的计数代表 原始问题是:给你⼀句话,它属于哪⼀类 通过 bayes rules 变成⼀个⽐较简单容易求得的问题 问题变成,这⼀类中这句话出现的概率是多少,当然,别忘了公式⾥的另外两个概率 栗⼦:单词 love 在 positive 的情况下出现的概率是 0.1,在 negative 的情况下出现的概率是 0.001 6. K最近邻 最近邻 k nearest neighbours 给⼀个新的数据时,离它最近的 k 个点中,哪个类别多,这个数据就属于哪⼀类 栗⼦:要区分 猫 和 狗,通过 claws 和 sound 两个feature来判断的话,圆形和三⾓形是已知分类的了,那么这个 star 代表的是哪⼀类呢 k=3时,这三条线链接的点就是最近的三个点,那么圆形多⼀些,所以这个star就是属于猫 7. K均值 均值 想要将⼀组数据,分为三类,粉⾊数值⼤,黄⾊数值⼩ 最开⼼先初始化,这⾥⾯选了最简单的 3,2,1 作为各类的初始值 剩下的数据⾥,每个都与三个初始值计算距离,然后归类到离它最近的初始值所在类别 分好类后,计算每⼀类的平均值,作为新⼀轮的中⼼点 ⼏轮之后,分组不再变化了,就可以停⽌了 8. Adaboost adaboost 是 bosting 的⽅法之⼀ bosting就是把若⼲个分类效果并不好的分类器综合起来考虑,会得到⼀个效果⽐较好的分类器。 下图,左右两个决策树,单个看是效果不怎么好的,但是把同样的数据投⼊进去,把两个结果加起来考虑,就会增加可信度 adaboost 的栗⼦,⼿写识别中,在画板上可以抓取到很多 features,例如 始点的⽅向,始点和终点的距离等等 training 的时候,会得到每个 feature 的 weight,例如 2 和 3 的开头部分很像,这个 feature 对分类起到的作⽤很
- 210KB
人工智能之机器学习常见算法.pdf
2023-02-27⼈⼯智能之机器学习常见算法 摘要 摘要 之前⼀直对机器学习很感兴趣,⼀直没时间去研究,今天刚好是周末,有时间去各⼤技术论坛看看,刚好看到⼀篇关于机器学习不错的⽂章,在这⾥ 就分享给⼤家了. 机器学习⽆疑是当前数据分析领域的⼀个热点内容。很多⼈在平时的⼯作中都或多或少会⽤到机器学习的算法。这⾥IT经理⽹为您总结⼀下 常见的机器学习算法,以供您在⼯作和学习中参考。 机器学习的算法很多。很多时候困惑⼈们都是,很多算法是⼀类算法,⽽有些算法⼜是从其他算法中延伸出来的。这⾥,我们从两个⽅⾯来 给⼤家介绍,第⼀个⽅⾯是学习的⽅式,第⼆个⽅⾯是算法的类似性。 学习⽅式 学习⽅式 根据数据类型的不同,对⼀个问题的建模有不同的⽅式。在机器学习或者⼈⼯智能领域,⼈们⾸先会考虑算法的学习⽅式。在机器学习领 域,有⼏种主要的学习⽅式。将算法按照学习⽅式分类是⼀个不错的想法,这样可以让⼈们在建模和算法选择的时候考虑能根据输⼊数据来 选择最合适的算法来获得最好的结果。 监督式学习: 监督式学习: 在监督式学习下,输⼊数据被称为"训练数据",每组训练数据有⼀个明确的标识或结果,如对防垃圾邮件系统中"垃圾邮件""⾮垃圾邮 件",对⼿写数字识别中的"1","2","3","4"等。在建⽴预测模型的时候,监督式学习建⽴⼀个学习过程,将预测结果与"训 练数据"的实际结果进⾏⽐较,不断的调整预测模型,直到模型的预测结果达到⼀个预期的准确率。监督式学习的常见应⽤场景如分类问题 和回归问题。常见算法有逻辑回归(Logistic Regression)和反向传递神经⽹络(Back Propagation Neural Network) ⾮监督式学习: ⾮监督式学习: 在⾮监督式学习中,数据并不被特别标识,学习模型是为了推断出数据的⼀些内在结构。常见的应⽤场景包括关联规则的学习以及聚类等。 常见算法包括Apriori算法以及k-Means算法。 半监督式学习: 半监督式学习: 在此学习⽅式下,输⼊数据部分被标识,部分没有被标识,这种学习模型可以⽤来进⾏预测,但是模型⾸先需要学习数据的内在结构以便合 理的组织数据来进⾏预测。应⽤场景包括分类和回归,算法包括⼀些对常⽤监督式学习算法的延伸,这些算法⾸先试图对未标识数据进⾏建 模,在此基础上再对标识的数据进⾏预测。如图论推理算法(Graph Inference)或者拉普拉斯⽀持向量机(Laplacian SVM.)等。 强化学习: 强化学习: 在这种学习模式下,输⼊数据作为对模型的反馈,不像监督模型那样,输⼊数据仅仅是作为⼀个检查模型对错的⽅式,在强化学习下,输⼊ 数据直接反馈到模型,模型必须对此⽴刻作出调整。常见的应⽤场景包括动态系统以及机器⼈控制等。常见算法包括Q-Learning以及时间 差学习(Temporal difference learning) 在企业数据应⽤的场景下, ⼈们最常⽤的可能就是监督式学习和⾮监督式学习的模型。 在图像识别等领域,由于存在⼤量的⾮标识的数据 和少量的可标识数据, ⽬前半监督式学习是⼀个很热的话题。 ⽽强化学习更多的应⽤在机器⼈控制及其他需要进⾏系统控制的领域。 算法类似性 算法类似性 根据算法的功能和形式的类似性,我们可以把算法分类,⽐如说基于树的算法,基于神经⽹络的算法等等。当然,机器学习的范围⾮常庞 ⼤,有些算法很难明确归类到某⼀类。⽽对于有些分类来说,同⼀分类的算法可以针对不同类型的问题。这⾥,我们尽量把常⽤的算法按照 最容易理解的⽅式进⾏分类。 回归算法: 回归算法: 回归算法是试图采⽤对误差的衡量来探索变量之间的关系的⼀类算法。回归算法是统计机器学习的利器。在机器学习领域,⼈们说起回归, 有时候是指⼀类问题,有时候是指⼀类算法,这⼀点常常会使初学者有所困惑。常见的回归算法包括:最⼩⼆乘法(Ordinary Least Square),逻辑回归(Logistic Regression),逐步式回归(Stepwise Regression),多元⾃适应回归样条(Multivariate Adaptive Regression Splines)以及本地散点平滑估计(Locally Estimated Scatterplot Smoothing) 基于实例的算法 基于实例的算法 基于实例的算法常常⽤来对决策问题建⽴模型,这样的模型常常先选取⼀批样本数据,然后根据某些近似性把新数据与样本数据进⾏⽐较。 通过这种⽅式来寻找最佳的匹配。因此,基于实例的算法常常也被称为"赢家通吃"学习或者"基于记忆的学习"。常见的算法包括 k- Nearest Neighbor(KNN), 学习⽮量量化(Learning Vector Quantization, LVQ),以及⾃组织映射算法(Self-Org
- 146KB
人工智能的常用十种算法(1).pdf
2023-02-27⼈⼯智能的常⽤⼗种算法 根据⼀些 feature 进⾏分类,每个节点提⼀个问题,通过判断,将数据分为两类,再继续提问。这些问题是根据已有数据学习出来的,再投 ⼊新数据的时候,就可以根据这棵树上的问题,将数据划分到合适的叶⼦上。 如果你觉得这篇⽂章看起来稍微还有些吃⼒,或者想要更系统地学习⼈⼯智能,那么推荐你去看床长⼈⼯智能教程。⾮常棒的⼤神之作,教 程不仅通俗易懂,⽽且很风趣幽默。点击可以查看教程。 2. 随机森林 随机森林 在源数据中随机选取数据,组成⼏个⼦集 S 矩阵是源数据,有 1-N 条数据,A B C 是feature,最后⼀列C是类别 由 S 随机⽣成 M 个⼦矩阵 这 M 个⼦集得到 M 个决策树 将新数据投⼊到这 M 个树中,得到 M 个分类结果,计数看预测成哪⼀类的数⽬最多,就将此类别作为最后的预测结果 3. 逻辑回归 逻辑回归 当预测⽬标是概率这样的,值域需要满⾜⼤于等于0,⼩于等于1的,这个时候单纯的线性模型是做不到的,因为在定义域不在某个范围之 内时,值域也超出了规定区间。 所以此时需要这样的形状的模型会⽐较好 那么怎么得到这样的模型呢? 这个模型需要满⾜两个条件 ⼤于等于0,⼩于等于1 ⼤于等于0 的模型可以选择 绝对值,平⽅值,这⾥⽤ 指数函数,⼀定⼤于0 ⼩于等于1 ⽤除法,分⼦是⾃⼰,分母是⾃⾝加上1,那⼀定是⼩于1的了 再做⼀下变形,就得到了 logistic regression 模型 1. 决策树 决策树 通过源数据计算可以得到相应的系数了 最后得到 logistic 的图形 4. SVM support vector machine 要将两类分开,想要得到⼀个超平⾯,最优的超平⾯是到两类的 margin 达到最⼤,margin就是超平⾯与离它最近⼀点的距离,如下 图,Z2>Z1,所以绿⾊的超平⾯⽐较好 将这个超平⾯表⽰成⼀个线性⽅程,在线上⽅的⼀类,都⼤于等于1,另⼀类⼩于等于-1 点到⾯的距离根据图中的公式计算 所以得到 total margin 的表达式如下,⽬标是最⼤化这个 margin,就需要最⼩化分母,于是变成了⼀个优化问题 举个栗⼦,三个点,找到最优的超平⾯,定义了 weight vector=(2,3)-(1,1) 得到 weight vector 为(a,2a),将两个点代⼊⽅程,代⼊(2,3)另其值=1,代⼊(1,1)另其值=-1,求解出 a 和 截矩 w0 的 值,进⽽得到超平⾯的表达式。 a 求出来后,代⼊(a,2a)得到的就是 support vector a 和 w0 代⼊超平⾯的⽅程就是 support vector machine 5. 朴素贝叶斯 朴素贝叶斯 举个在 NLP 的应⽤ 给⼀段⽂字,返回情感分类,这段⽂字的态度是positive,还是negative 为了解决这个问题,可以只看其中的⼀些单词 这段⽂字,将仅由⼀些单词和它们的计数代表 原始问题是:给你⼀句话,它属于哪⼀类 通过 bayes rules 变成⼀个⽐较简单容易求得的问题 问题变成,这⼀类中这句话出现的概率是多少,当然,别忘了公式⾥的另外两个概率 栗⼦:单词 love 在 positive 的情况下出现的概率是 0.1,在 negative 的情况下出现的概率是 0.001 6. K最近邻 最近邻 k nearest neighbours 给⼀个新的数据时,离它最近的 k 个点中,哪个类别多,这个数据就属于哪⼀类 栗⼦:要区分 猫 和 狗,通过 claws 和 sound 两个feature来判断的话,圆形和三⾓形是已知分类的了,那么这个 star 代表的是哪⼀类呢 k=3时,这三条线链接的点就是最近的三个点,那么圆形多⼀些,所以这个star就是属于猫 7. K均值 均值 想要将⼀组数据,分为三类,粉⾊数值⼤,黄⾊数值⼩ 最开⼼先初始化,这⾥⾯选了最简单的 3,2,1 作为各类的初始值 剩下的数据⾥,每个都与三个初始值计算距离,然后归类到离它最近的初始值所在类别 分好类后,计算每⼀类的平均值,作为新⼀轮的中⼼点 ⼏轮之后,分组不再变化了,就可以停⽌了 8. Adaboost adaboost 是 bosting 的⽅法之⼀ bosting就是把若⼲个分类效果并不好的分类器综合起来考虑,会得到⼀个效果⽐较好的分类器。 下图,左右两个决策树,单个看是效果不怎么好的,但是把同样的数据投⼊进去,把两个结果加起来考虑,就会增加可信度 adaboost 的栗⼦,⼿写识别中,在画板上可以抓取到很多 features,例如 始点的⽅向,始点和终点的距离等等 training 的时候,会得到每个 feature 的 weight,例如 2 和 3 的开头部分很像,这个 feature 对分类起到的作⽤很
- 328KB
AI 人工智能的本质和未来
2018-09-12有助于我们了解人工智能的本质、消除疑惑,有利于对未来的思考与学习。
- 451KB
机器学习十大算法:AdaBoost.pdf
2021-09-27机器学习十大算法:AdaBoost.pdf
- 1.41MB
四大机器学习降维算法:PCA、LDA、LLE、Laplacian Eigenmaps.pdf
2022-07-10四大机器学习降维算法:PCA、LDA、LLE、Laplacian Eigenmaps.pdf四大机器学习降维算法:PCA、LDA、LLE、Laplacian Eigenmaps.pdf四大机器学习降维算法:PCA、LDA、LLE、Laplacian Eigenmaps.pdf四大机器学习降维算法...
- 1.64MB
四大机器学习降维算法:PCA、LDA、LLE、Laplacian-Eigenmaps.pdf
2022-07-10四大机器学习降维算法:PCA、LDA、LLE、Laplacian-Eigenmaps.pdf四大机器学习降维算法:PCA、LDA、LLE、Laplacian-Eigenmaps.pdf四大机器学习降维算法:PCA、LDA、LLE、Laplacian-Eigenmaps.pdf四大机器学习降维算法...
- 360KB
机器学习十大算法:kNN
2012-02-21机器学习十大算法:kNN 机器学习十大算法:kNN
- 119.99MB
2019年度人工智能算法文章合集.pdf
2020-06-242019年度人工智能算法文章合集.pdf
- 1.81MB
人工智能算法岗笔试题(截图).pdf
2019-07-17本文档为阿里2018年算法笔试题,为截图格式。有需要的可以参考下
- 1.8MB
《论智能》
2018-04-04杰夫 霍金斯杰夫 霍金斯杰夫 霍金斯杰夫 霍金斯杰夫 霍金斯杰夫 霍金斯杰夫 霍金斯
- 46.28MB
noip所有算法详解(非常全面)
2011-12-04本人精心整理自互联网,解压后约150MB,倍增、博弈、递归、递推、贪心、图论、动归、数论、搜索、数据结构(各种树形)、位运算、随机化、分治、字符串、排序、几何 当然noi的部分高级算法并未涉及,但针对noip是相当全面的!!
- 456KB
MATLAB R2012b
2018-04-10MATLAB R2012b,没过期,不过期,2018年后仍然可以使用
- 2.5MB
EM算法:机器学习之EM算法实现
2012-06-01机器学习之EM算法实现.rar
- 3.23MB
机器学习算法与应用.pdf
2021-09-24机器学习算法与应用.pdf
- 657KB
机器学习十大算法:Apriori.pdf
2011-11-21机器学习十大算法:Apriori.pdf机器学习十大算法:Apriori.pdf
- 10.11MB
Python数据分析实践:机器学习算法简介.pdf
2022-06-14Python数据分析实践:机器学习算法简介.pdf
- 974KB
人工智能与机器学习:算法基础和哲学观点.pdf
2021-09-24人工智能与机器学习:算法基础和哲学观点.pdf
- 5.1MB
3.机器学习常用算法.pdf
2019-08-13配套博客:https://blog.csdn.net/qq_41739364/column/info/42524 的 第 4 篇。
- 8.39MB
解密阿里内部人工智能算法迭代工具AIBoost.pdf
2019-08-29算法专家 风奇在2017云栖大会·北京峰会中做了题为《解密阿里内部人工智能算法迭代工具AI Boost》的分享,就机器智能的迭代: AI Boost,挑战与未来等方面的内容做了深入的分析。
- 2.61MB
人工智能在移动通信网络中的应用:基于机器学习理论的信道估计与信号检测算法.pdf
2021-09-24人工智能在移动通信网络中的应用:基于机器学习理论的信道估计与信号检测算法.pdf
- 12.23MB
[人工智能导论模型与算法吴飞pdf]由PDF转成MP4(高清完整版)
2023-08-02人工智能导论模型与算法课件版 由PDF转成MP4(高清完整版)
- 35KB
手把手教你使用Python实现机器学习算法.pdf
2022-06-16手把手教你使用Python实现机器学习算法.pdf手把手教你使用Python实现机器学习算法.pdf手把手教你使用Python实现机器学习算法.pdf手把手教你使用Python实现机器学习算法.pdf手把手教你使用Python实现机器学习算法.pdf...
- 25.73MB
AI人工智能学习 一、算法基础:机器学习 1.matplotlib 2.numpy 3.pandas 4.seaborn
2024-01-12AI人工智能学习 一、算法基础:机器学习 1.matplotlib 2.numpy 3.pandas 4.seaborn 5.K近邻算法 6.线性回归 7.逻辑回归 8.决策树 9.集成学习 10.聚类算法 11.朴素贝叶斯 12.SVM算法 13.EM算法 14.HMM算法 15.集成...
- 345KB
机器学习十大算法:kNN.pdf
2022-03-19机器学习十大算法:kNN.pdf
- 2.13MB
四大机器学习降维算法:PCA、LDA、LLE、LaplacianEigenmaps.pdf
2021-10-05四大机器学习降维算法:PCA、LDA、LLE、LaplacianEigenmaps.pdf