没有合适的资源?快使用搜索试试~ 我知道了~
kNN算法是k-近邻算法的简称,主要用来进行分类实践,主要思路如下: 1.存在一个训练数据集,每个数据都有对应的标签,也就是说,我们知道样本集中每一数据和他对应的类别。 2.当输入一个新数据进行类别或标签判定时,将新数据的每个特征值与训练数据集中的每个数据进行比较,计算其到训练数据集中每个点的距离(下列代码实现使用的是欧式距离)。 3.然后提取k个与新数据最接近的训练数据点所对应的标签或类别。 4.出现次数最多的标签或类别,记为当前预测新数据的标签或类别。 欧式距离公式为: distance= sqrt((xA0-XB0)^2+(xA1-XB1)^2+…+(xAn-XBn)^2)(若数据
资源详情
资源评论
资源推荐
Python代码实现代码实现KNN算法算法
kNN算法是k-近邻算法的简称,主要用来进行分类实践,主要思路如下:
1.存在一个训练数据集,每个数据都有对应的标签,也就是说,我们知道样本集中每一数据和他对应的类别。
2.当输入一个新数据进行类别或标签判定时,将新数据的每个特征值与训练数据集中的每个数据进行比较,计算其到训练数据
集中每个点的距离(下列代码实现使用的是欧式距离)。
3.然后提取k个与新数据最接近的训练数据点所对应的标签或类别。
4.出现次数最多的标签或类别,记为当前预测新数据的标签或类别。
欧式距离公式为:
distance= sqrt((xA0-XB0)^2+(xA1-XB1)^2+…+(xAn-XBn)^2)(若数据有n个特征项)
以下为代码实现:
#! /usr/bin/python
#coding=utf-8
from numpy import *
import operator
def createDataSet():
group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])#训练数据样本集合
labels = ['A','A','B','B']#训练数据对应的类别
return group,labels
'''''
inX:用于分类的输入向量
dataSet:训练样本集合
labels:标签向量
k:k-近邻算法中的k
'''
def classify0(inX,dataSet,labels,k):
dataSetSize = dataSet.shape[0] #获取数组的维度,也就是获取训练样本的行数(样本数),若获取列数,则为shape[1] diffMat = tile(inX,
(dataSetSize,1)) - dataSet # tile 表示inX在重复dataSetSize行,重复1列。为输入向量与各个样本求取欧式距离做准备。
sqDiddMat = diffMat**2 #diffMat是输入向量与我们训练样本每个点相减得到的,**2表示值的结果取平方。
sqDistances = sqDiddMat.sum(axis=1)#默认为axis=0,axis=1以后就是将一个矩阵的每一行向量相加
distances = sqDistances**0.5 #对结果进行开平方,得到输入向量与每个训练样本中点的欧式距离
sorteDistIndicies = distances.argsort()#将距离结果按照从小到大排序获得索引值
classcount={} #这是一个字典,key为类别,value为距离最小的前k个样本点里面为该类别的个数。
for i in range(k):
voteIlabel = labels[sorteDistIndicies[i]]#获取距离最小的前k个样本点对应的label值
classcount[voteIlabel] = classcount.get(voteIlabel,0)+1 #如果之前的样本点label值与与现在的相同,则累计加1,否则,此次加1
sorteClassCount = sorted(classcount.iteritems(),key=operator.itemgetter(1),reverse=True) #针对calsscount获取对象的第1个域的值进行降序排序。也就
是说根据类别的个数从大到小排序。
return sorteClassCount[0][0] #返回排序的字典的第一个元素的key,即分类后的类别
createDataSet()
print classify0([0.9,0.9],group,labels,3)
结果为:A
您可能感兴趣的文章您可能感兴趣的文章:以Python代码实例展示kNN算法的实际运用使用python实现knn算法python实现kNN算法机器学习之
KNN算法原理及Python实现方法详解Python语言描述KNN算法与Kd树纯python实现机器学习之kNN算法示例python使用KNN
算法手写体识别Python实现的knn算法示例python可视化实现KNN算法
weixin_38604916
- 粉丝: 6
- 资源: 892
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0