没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示


试读
12页
邻近算法,或者说K最邻近(KNN,K-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻近值来代表。近邻算法就是将数据集合中每一个记录进行分类的方法. KNN(K- Nearest Neighbor)法即K最邻近法,最初由 Cover和Hart于1968年提出,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路非常简单直观:如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别 [2] 。 该方法的不足之处是计算量较大,因为对每一个待分类的文本都要计算它到全体已知样本的距离,才能求得它的K个最邻近点。目前常用的解决方法是事先对已知样本点进行剪辑,事先去除对分类作用不大的样本。另外还有一种 Reverse KNN法,它能降低KNN算法的计算复杂度,提高分类的效率 [2] 。 KNN算法比较适用于样本容量比较大的类域的自动分类
资源详情
资源评论
资源推荐

K-
近
邻
算
法
1
🎫
K-
近
邻
算
法
⼀
、
概
述
K-
近
邻
算
法
,
⼜
称
为
KNN
算
法
,
是
数
据
挖
掘
技
术
中
原
理
最
简
单
的
算
法
。
KNN
的
⼯
作
原
理
:
给
定
⼀个
已
知
类
别
标
签
的
数
据
训
练
集
,
输
⼊
没
有
标
签
的
新数
据
后
,
在
训
练
数
据
集
中
找
到
与
新数
据
最
临
近
的
K
个
实
例
。
如
果
这
K
个
实
例
的
多
数
属
于
某
个
类
别
,
那
么
新数
据
就属
于
这
个
类
别
。
简
单
理
解
为
:
由
那
些
离
X
最
近
的
K
个
点
来
投
票
决
定
X
归
为
哪
⼀
类

K-
近
邻
算
法
2
举个
例
⼦
,
可
以
⽤
KNN
算
法
来
分
类
⼀
部
电
影
是
爱
情
⽚
还
是
动
作
⽚
(
利
⽤
打
架
镜
头
和
接
吻
镜
头
来
做
⼤
致
判
断
)
这
个
表
就
是
我
们
已
有
的
数
据
集
合
,
也
就
是
训
练
样
本
集
。

K-
近
邻
算
法
3
这
个
数
据
集
有
两个
特
征
-
打
⽃
镜
头
数
和
亲
吻
镜
头
数
。
除
此
之
外
,
我
们
还
知
道
每
部
电
影
的
所
属
类
型
,
即
分
类
样
本
。
那
么
这
样
⼦
我
们
该
如
何
运
⽤
KNN
算
法
来
判
断
表
中
的
新
电
影
所
属
的
电
影
类
别
呢
?
如
下
图
所
⽰
从
散
点
图
中
我
们
可
以
分
析
⼤
致
推
断
,
这
个
电
影很
有
可
能
是
爱
情
⽚
,
因
为
它
的
距
离
和
已
知
的
三个
爱
情
⽚
更
近
⼀
点
。
KNN
算
法
是
利
⽤
什
么
⽅
法
进
⾏
判
断
的
呢
?
没
错
,
就
是
距
离
度
量
✨
在
⼆
维
平
⾯
中
可
以
使
⽤
⾼
中
就
学
过
的
距
离
计
算
公
式
如
果
是
多
个
特
征
拓
展
到
N
维
空
间
的
话
,
我
们
可
以
使
⽤
欧
⽒
距
离
(
也
称
欧
⼏
⾥
得
度
量
)
,
如
下
所
⽰
:
通过
计
算
可
以
得
到
训
练
集
中
所
有
的
电
影
和
新
电
影
之
间
的
距
离
,
如
下
图
所
⽰
AB =∣ ∣
(x − x ) + (y − y )
1 2
2
1 2
2
dist(x, y) = =(x − y ) + (x − y ) + ... + (x − y )
1 1
2
2 2
2
n n
2
(x − y )∑
i = 1
n
i i
2
剩余11页未读,继续阅读




















玄澈_
- 粉丝: 8736
- 资源: 4
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


安全验证
文档复制为VIP权益,开通VIP直接复制

评论0