K近邻法(k-nearst neighbors,KNN)是一种很基本的机器学习方法。
它的基本思想是: 在训练集中数据和标签已知的情况下,输入测试数据,将测试数据的特征与训练集中对应的特征进行相互比较,找到训练集中与之最为相似的前K个数据,则该测试数据对应的类别就是K个数据中出现次数最多的那个分类。
在此算法中,相似性由欧几里德距离定义,其中两个点X(x1,x2,…,xn)和Y(y1,y2,…,yn)的欧几里德距离是:
D(X,Y)=√(〖(x1-y1)〗^2+〖(x2-y2)〗^2+⋯+〖(xn-yn)〗^2 )
该算法涉及3个主要因素:训练集、距离或相似的衡量、k的大小。
评论0
最新资源