# 《机器学习实战》练习代码
书中代码是python2+的,练习代码都用python3+实现
## ch2:KNN算法
计算特征数据间的距离公式
![image](http://latex.codecogs.com/gif.latex?d=\sqrt{{(x-x1)}^2+{(x-x2)}^2...{(x-xi)}^2})
## ch3:决策树
决策树最重要的两个公式为信息熵和信息增益的计算
设样本集合D中的第K类样本所占的比例是Pk,则信息熵的计算公式:
![image](http://latex.codecogs.com/gif.latex?Ent(D)=-\sum_{k=1}^{|y|}P_{k}log_{2}P_{k})
假设离散属性(特征)a有V个可能的取值,若使用a来对样本数据基D进行划分,则就有V个分支节点,其中第v个取值包含的数据量为Dv,计算出Dv的信息熵,给每个分支节点赋予Dv/D的权重,即样本分支节点的信息熵越大,它获得的信息增益越大。具体信息增益计算方法为
![image](http://latex.codecogs.com/gif.latex?Gain(D,a)=Ent(D)-\sum_{v=1}^{V}\frac{|D_{v}|}{|D|}Ent(D^v))
## ch4:朴素贝叶斯
条件概率公式
![image](http://latex.codecogs.com/gif.latex?p(c|x)=\frac{p(x|c)p(c)}{p(x)})
p(x|c)=sum(xi|c)
如果p(c1|x,y)>p(c2|x,y) 那么分类就是c1,反之亦然
## ch5:Logistic回归
阶跃函数Sigmod
![image](http://latex.codecogs.com/gif.latex?\delta(z)=\frac{1}{1+e^{-z}})
其中
![image](http://latex.codecogs.com/gif.latex?z=w_{0}x_{0}+w_{1}x_{1}+...+w_{n}x_{n})
## ch6:支持向量机
没有合适的资源?快使用搜索试试~ 我知道了~
《机器学习实战》学习代码.zip
共2000个文件
txt:1996个
py:3个
md:1个
需积分: 5 0 下载量 36 浏览量
2024-04-07
11:55:09
上传
评论
收藏 763KB ZIP 举报
温馨提示
机器学习是人工智能及模式识别领域的共同研究热点,其理论和方法已被广泛应用于解决工程应用和科学领域的复杂问题。2010年的图灵奖获得者为哈佛大学的Leslie vlliant教授,其获奖工作之一是建立了概率近似正确(Probably Approximate Correct,PAC)学习理论;2011年的图灵奖获得者为加州大学洛杉矶分校的Judea Pearll教授,其主要贡献为建立了以概率统计为理论基础的人工智能方法。这些研究成果都促进了机器学习的发展和繁荣。 [2] 机器学习是研究怎样使用计算机模拟或实现人类学习活动的科学,是人工智能中最具智能特征,最前沿的研究领域之一。自20世纪80年代以来,机器学习作为实现人工智能的途径,在人工智能界引起了广泛的兴趣,特别是近十几年来,机器学习领域的研究工作发展很快,它已成为人工智能的重要课题之一。机器学习不仅在基于知识的系统中得到应用,而且在自然语言理解、非单调推理、机器视觉、模式识别等许多领域也得到了广泛应用。一个系统是否具有学习能力已成为是否具有“智能”的一个标志。机器学习的研究主要分为两类研究方向:第一类是传统机器学习的研究,该类研究主要是研究学习机制,注重探索模拟人的学习机制;第二类是大数据环境下机器学习的研究,该类研究主要是研究如何有效利用信息,注重从巨量数据中获取隐藏的、有效的、可理解的知识。 [2] 机器学习历经70年的曲折发展,以深度学习为代表借鉴人脑的多分层结构、神经元的连接交互信息的逐层分析处理机制,自适应、自学习的强大并行信息处理能力,在很多方面收获了突破性进展,其中最有代表性的是图像识别领域。
资源推荐
资源详情
资源评论
收起资源包目录
《机器学习实战》学习代码.zip (2000个子文件)
README.md 1KB
bayes.py 5KB
logregres.py 5KB
svmMliA.py 1KB
horseColicTraining.txt 59KB
datingTestSet.txt 34KB
horseColicTest.txt 4KB
testSetRBF2.txt 3KB
testSetRBF.txt 3KB
testSet.txt 2KB
testSet.txt 2KB
6.txt 1KB
2_54.txt 1KB
5_15.txt 1KB
1_15.txt 1KB
9_51.txt 1KB
0_24.txt 1KB
5_41.txt 1KB
5_71.txt 1KB
3_47.txt 1KB
1_76.txt 1KB
9_40.txt 1KB
0_6.txt 1KB
9_30.txt 1KB
5_3.txt 1KB
9_78.txt 1KB
7_92.txt 1KB
6_16.txt 1KB
8_86.txt 1KB
7_36.txt 1KB
8_27.txt 1KB
3_14.txt 1KB
1_62.txt 1KB
9_74.txt 1KB
6_12.txt 1KB
5_23.txt 1KB
4_69.txt 1KB
1_20.txt 1KB
3_3.txt 1KB
5_40.txt 1KB
9_23.txt 1KB
8_53.txt 1KB
3_38.txt 1KB
3_78.txt 1KB
1_54.txt 1KB
2_79.txt 1KB
4_41.txt 1KB
3_72.txt 1KB
4_62.txt 1KB
6_60.txt 1KB
4_52.txt 1KB
0_84.txt 1KB
7_45.txt 1KB
2_43.txt 1KB
8_28.txt 1KB
8_29.txt 1KB
4_22.txt 1KB
2_71.txt 1KB
7_48.txt 1KB
7_9.txt 1KB
9_63.txt 1KB
7_93.txt 1KB
1_25.txt 1KB
7_40.txt 1KB
6_30.txt 1KB
9_11.txt 1KB
2_83.txt 1KB
4_51.txt 1KB
7_15.txt 1KB
5_24.txt 1KB
5_12.txt 1KB
8_8.txt 1KB
7_77.txt 1KB
5_53.txt 1KB
8_22.txt 1KB
3_70.txt 1KB
2_37.txt 1KB
5_60.txt 1KB
8_54.txt 1KB
1_29.txt 1KB
4_97.txt 1KB
4_79.txt 1KB
4_88.txt 1KB
9_66.txt 1KB
2_32.txt 1KB
2_78.txt 1KB
1_73.txt 1KB
5_79.txt 1KB
7_73.txt 1KB
4_70.txt 1KB
2_12.txt 1KB
0_17.txt 1KB
2_23.txt 1KB
8_10.txt 1KB
2_90.txt 1KB
1_48.txt 1KB
2_28.txt 1KB
0_38.txt 1KB
1_33.txt 1KB
1_22.txt 1KB
共 2000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 20
资源评论
生瓜蛋子
- 粉丝: 3825
- 资源: 5370
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功