KNN.rar_K._KNNjava资源-CSDN文库

共6个文件

txt：5个

pdf：1个

版权申诉

140 浏览量 2022-09-14 21:11:12 上传评论收藏 188KB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

KNN.rar （6个子文件）

KNN

KNN.txt 3KB

KNN算法及Java实现.pdf 196KB

testfile.txt 198B

TestKNN.txt 2KB

datafile.txt 208B

KNNNode.txt 642B

KNN 算法及 Java 实现

1.KNN 算法原理

基于类比学习，通过比较训练元组和测试元组的相似度来学习。

将训练元组和测试元组看作是 n 维（若元组有 n 的属性）空间内的点，给定一条测试元组，搜索 n 维空间，

找出与测试

元组最相近的 k 个点（即训练元组），最后取这 k 个点中的多数类作为测试元组的类别。

相近的度量方法：用空间内两个点的距离来度量。距离越大，表示两个点越不相似。

距离的选择：可采用欧几里得距离、曼哈顿距离或其它距离度量。多采用欧几里得距离，简单！

2.KNN 算法中的细节处理

数值属性规范化：将数值属性规范到 0-1 区间以便于计算，也可防止大数值型属性对分类的主导作用。

可选的方法有：v' = （v - vmin）/ (vmax - vmin)，当然也可以采用其它的规范化方法

比较的属性是分类类型而不是数值类型的：同则差为 0，异则差为 1.有时候可以作更为精确的处理，比如

黑色与白色的差肯定要大于灰色与白色的差。

缺失值的处理：取最大的可能差，对于分类属性，如果属性 A 的一个或两个对应值丢失，则取差值为 1；

如果 A 是数值属性，若两个比较的元组 A 属性值均缺失，则取差值为 1，若只有一个缺失，另一个值为 v，

则取差值为｜1-v｜和｜0-v｜中的最大值

确定 K 的值：通过实验确定。进行若干次实验，取分类误差率最小的 k 值。

对噪声数据或不相关属性的处理：对属性赋予相关性权重 w，w 越大说明属性对分类的影响越相关。对噪声

数据可以将所在的元组直接 cut 掉。

3.KNN 算法流程

1）准备数据，对数据进行预处理

2）选用合适的数据结构存储训练数据和测试元组

3）设定参数，如 k

4）维护一个大小为 k 的的按距离由大到小的优先级队列，用于存储最近邻训练元组。随机从训练元组中选

取 k 个元组作为初始的最近邻元组，分别计算测试元组到这 k 个元组的距离，将训练元组标号和距离存入

优先级队列

5）遍历训练元组集，计算当前训练元组与测试元组的距离，将所得距离 L 与优先级队列中的最大距离 Lmax

进行比较。若 L>=Lmax，则舍弃该元组，遍历下一个元组。若 L < Lmax，删除优先级队列中最大距离的元

组，将当前训练元组存入优先级队列。

6）遍历完毕，计算优先级队列中 k 个元组的多数类，并将其作为测试元组的类别。

7）测试元组集测试完毕后计算误差率，继续设定不同的 k 值重新进行训练，最后取误差率最小的 k 值。

KNN 算法 java 实现

package cqu.KNN;

//KNN结点类，用来存储最近邻的k个元组相关的信息

public class KNNNode {

private int index; // 元组标号

private double distance; // 与测试元组的距离

private String c; // 所属类别

public KNNNode(int index, double distance, String c) {

super();

this.index = index;

this.distance = distance;

this.c = c;

}

public int getIndex() {

return index;

}

public void setIndex(int index) {

this.index = index;

}

public double getDistance() {

return distance;

}

public void setDistance(double distance) {

this.distance = distance;

}

public String getC() {

return c;

}

public void setC(String c) {

this.c = c;

}

package cqu.KNN;

import java.util.ArrayList;

import java.util.Comparator;

import java.util.HashMap;

import java.util.List;

import java.util.Map;

import java.util.PriorityQueue;

// KNN算法主体类

public class KNN {

/**

* 设置优先级队列的比较函数，距离越大，优先级越高

private Comparator<KNNNode> comparator = new Comparator<KNNNode>() {

public int compare(KNNNode o1, KNNNode o2) {

if (o1.getDistance() >= o2.getDistance()) {

return -1;

} else {

return 1;

}

};

/**

* 获取K个不同的随机数

* @param k 随机数的个数

* @param max 随机数最大的范围

* @return 生成的随机数数组

public List<Integer> getRandKNum(int k, int max) {

List<Integer> rand = new ArrayList<Integer>(k);

for (int i = 0; i < k; i++) {

int temp = (int) (Math.random() * max);

if (!rand.contains(temp)) {

rand.add(temp);

} else {

i--;

}

return rand;

}

/**

* 计算测试元组与训练元组之前的距离

* @param d1 测试元组

评论收藏

内容反馈

版权申诉

林当时

粉丝: 97
资源: 1万+

KNN.rar_K._KNN java

最新资源

KNN.rar_K._KNN java

KNN.rar_K._knn

knn.rar_K._KNN分类算法

KNN.rar_K-NEAREST ALGORITHM_K._KNN java_java k-neighbor

knn.rar_KNN java_KNN算法 java_knn算法_knn算法java实现

KNN.rar_K._KNN java_KNN 特征_k最邻近_特征筛选

KNN.rar_KNN java_knn_knn using java_knn算法

KNN.rar_java k-nn_knn算法_weka k_weka knn

knn.rar_NEIGHBOR JAVA_java KNN_knn_nearest neighbor ja_分类算法 jav

Knn-java.rar_KNN java_KNN改进_KNN算法的改进_java KNN

KNN.rar_KNN java_KNN算法java_knn

KNN.rar_K-means KNN_K._knn matlab_knn算法

KNN.rar_K._KNN 定位_KNN定位_定位knn

knn.rar_K._KNN 分类_knn 鍒嗙被

knn.rar_K._KNN Classification_k nearest neighbor

java-knn-2.rar_Knn-java_knn

KNN.rar_KDD_The Process_k-nearest neighbor _kdd knn_knn kdd

knn.rar_knn

knn_java.rar_knn数据_数据挖掘算法

knn.rar_knn 文本分类

knn.rar_K._KNN K_knn_knn matlab

KNN分类.rar_K._KNN五分类_k-最近邻_k最近邻_识别k近邻

knn.zip_K._java KNN_knn、KNN、邻近算法_knn算法

KNN.rar_K._KNN程序_knn_knn matlab

knn_java.zip_K._KNN java

Knn算法——数据挖掘.rar_Knn-java

KNN约会.rar

基于Java实现KNN手写数字识别项目（源码+数据）.rar

基于Matlab实现KNN近邻法分类器（源码+数据）.rar

K近邻java实现.rar

最新资源