没有合适的资源?快使用搜索试试~ 我知道了~
Python机器学习(scikit-learn):k最近邻 (k-NN)、特征缩放(标准化归一化数据)-谢TS的博客.pdf
需积分: 5 1 下载量 138 浏览量
2023-07-19
10:33:43
上传
评论
收藏 1.61MB PDF 举报
温馨提示
试读
17页
k近邻算法 (k-NN, K-NearestNeighbor)。k-NN 算法构建模型只需要保存训练集数据即可。k-NN 模型把样本的所有特征构造一个坐标系(二维、三维 或 更高维),每一个样本都在坐标系中对应一个点(坐标由样本的所有特征组成)。想对新数据点做出预测,算法会在训练集数据点构成的坐标系中找到最近的 k 个数据点(也就是它的“最近邻”),然后根据这个 k 个数据点对新数据做出预测。当样本特征数据在运算时,为了减小不同特征取值范围误差,可以把特征数据缩放为标准化数据。均值为 0,方差为 1 的数据
资源推荐
资源详情
资源评论
https://xiets.blog.csdn.net/article/details/130957522
1/17
Python
机
器
学
习
(scikit-learn)
:
监督
学
习
--- k
最
近邻
(k-NN)
、
特
征
缩
放
(
标
准化
数据
/
归
⼀
化
数据
)
谢
TS
于
2023-05-30 21:46:57
发
布
原
⽂
链
接
:
https://xiets.blog.csdn.net/article/details/130957522
版
权
声
明
:
原
创
⽂
章禁
⽌
转载
专
栏
⽬
录
:
scikit-learn
专
栏
(
总
⽬
录
)
scikit-learn
官
⽅
相
关
⽹
站
:
官
⽹
: https://scikit-learn.org/
⽤
户指
南
(
实
例
教
程
): https://scikit-learn.org/stable/user_guide.html
API (
各
模
块
、
模
型
类
): https://scikit-learn.org/stable/modules/classes.html
参
考
书
籍
:
Python
机
器
学
习
基
础
教
程
— [
德
]
安
德
⾥
亚
斯
·
穆
勒
/ [
美
]
莎
拉
·
吉
多
scikit-learn
机
器
学
习
(
第
2
版
)
— [
美
]
加
⽂
·
海
克
(Gavin Hackeling)
最
近邻
教
程
(
官
⽹
): Nearest Neighbors
1. k
近邻
(k-NN)
算
法
k
近邻
算
法
(k-NN, K-NearestNeighbor)
。
k-NN
算
法
构
建
模
型
只
需
要
保
存
训
练
集
数据
即可
。
k-NN
模
型
把
样本
的
所
有
特
征
构
造
⼀个
坐
标
系
(
⼆
维
、
三
维
或
更
⾼
维
),
每
⼀
个
样本
都
在坐
标
系
中
对
应
⼀个
点
(
坐
标
由
样本
的
所
有
特
征
组
成
)
。
想
对
新数据
点
做出
预
测
,
算
法
会
在
训
练
集
数据
点
构
成
的
坐
标
系
中
找
到
最
近
的
k
个
数据
点
(
也
就
是
它
的
“
最
近邻
”
),
然
后
根
据
这
个
k
个
数据
点
对
新数据
做出
预
测
。
scikit-learn
的
k
近邻
算
法
模
型
类
在
sklearn.neighbors
包
中
,
包
括
许
多
不
同
的
近邻
模
型
,
常
⽤
的
模
型
类
有
:
neighbors.KNeighborsClassifier()
⽤
于
分
类
任
务
的
k
近邻
分
类
器
。
Python
机
器
学
习
(sc…
专
栏
收
录
该
内
容
8
篇
⽂
章
1000
订
阅
内
容
来
源
:
csdn.net
作
者
昵
称
:
谢
TS
原
⽂
链
接
:
https://xiets.blog.csdn.net/article/details/130957522
作
者
主
⻚
:
https://xiets.blog.csdn.net
https://xiets.blog.csdn.net/article/details/130957522
2/17
neighbors.KNeighborsRegressor()
⽤
于
回
归
任
务
的
k
近邻
回
归
模
型
。
2. k
近邻
分
类
(
KNeighborsClassifier
)
k-NN
算
法
⽤
于
分
类
,
就
是
在
训
练
集
中
找
出
距
离
想
要
预
测
的
新数据
点
最
近
的
k
个
数据
点
,
然
后
这
k
个
数据
点
中
类
别
最
多
的
类
型
就
是
预
测
的
结
果
类
型
。
数据
集
中
的
可
能
输
出
叫
做
类
别
。
neighbors.KNeighborsClassifier()
是
⽤
于
k
近邻
算
法
的
分
类
模
型
。
KNeighborsClassifier
构
造
⽅
法
:
class KNeighborsClassifier(n_neighbors=5, *,
weights='uniform',
algorithm='auto',
leaf_size=30,
p=2,
metric='minkowski',
metric_params=None,
n_jobs=None)
#
参
数
说
明
:
# n_neighbors int,
默
认
为
5,
查
询
的
邻
居
数
,
也
就
是
k-NN
中
k
的
数
量
。
#
# weights {'uniform', 'distance'}
或
可
调
⽤
对
象
,
默
认
='uniform'
。
#
预
测
中使
⽤
的
权
重
函
数
,
可
能
的
值
:
# 'uniform':
统
⼀
的
权
重
,
每
个
邻
域
中
的
所
有
点
的
权
重
相
等
。
# 'distance':
权
重
点
的
距
离
的
倒
数
,
在
这
种
情
况
下
,
查
询
点
的
较近
的
邻
居将
⽐
较远
的
邻
居
具
有更
⼤
的
影
响
。
# [callable]:
⼀个
⽤
户
定
义
的
函
数
,
它
接
受
⼀个
距
离
数
组
,
并
返
回
⼀个
包
含
权
重
的相
同
形
状
的
数
组
。
#
# algorithm {'auto', 'ball_tree', 'kd_tree', 'brute'},
默
认
='auto'
。
#
⽤
于
计
算
最
近邻
的
算
法
,
可
能
的
值
:
# 'ball_tree':
将
使
⽤
BallTree
# 'kd_tree':
将
使
⽤
KDTree
# 'brute':
将
使
⽤
暴
⼒
搜
索
# 'auto':
将尝
试
根
据
传
递
给
fit()
⽅
法
的
值
来
决
定
最
合
适
的
算
法
#
# leaf_size int,
默
认
=30
。
叶
⼤
⼩
,
传
递
给
BallTree
或
KDTree
。
#
这
会
影
响
构
建
和
查
询
的
速
度
,
以
及
存
储
树
所
需
的
内
存
。
最
佳
值
取
决
于
问题
的
性
质
。
#
# p int,
默
认
=2
。
Minkowski
度
量
的
功
率
参
数
。
#
# metric str
或
可
调
⽤
,
默
认
='minkowski'
。
⽤
于
距
离
计
算
的
度
量
。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
内
容
来
源
:
csdn.net
作
者
昵
称
:
谢
TS
原
⽂
链
接
:
https://xiets.blog.csdn.net/article/details/130957522
作
者
主
⻚
:
https://xiets.blog.csdn.net
https://xiets.blog.csdn.net/article/details/130957522
3/17
KNeighborsClassifier
属
性
:
KNeighborsClassifier
⽅
法
:
scikit-learn
中
监督
学
习
算
法
的
分
类
和
回
归
模
型
类
,
称
为
估
计
器
。
所
有
的
估
计
器
都
有
下
⾯
三个
通
⽤
⽅
法
:
⽅
法
描
述
fit(X, y)
训
练
模
型
,
⽤
训
练
集
数据
(X-y
输
⼊
输
出
对
)
训
练
模
型
,
即
⽤
训
练
集
数据
拟
合
出
⼀个
通
⽤
模
型
。
fit()
函
数
的
返
回
值
是
估
计
器
本
身
( self )
。
predict(X)
给
出
预
测
,
预
测
新数据
X(
输
⼊
)
对
应
的
y(
输
出
)
,
调
⽤
fit()
⽅
法
后
调
⽤
。
score(X,
y)
评
估
模
型
,
⽤
测
试
集
数据
(X-y
输
⼊
输
出
对
)
评
估
模
型
的
性
能
,
调
⽤
fit()
⽅
法
后
调
⽤
,
返
回
值
范
围
[0.0, 1.0]
。
对
于
分
类
任
务
,
score()
返
回
值
表
示
对
分
类
的
准
确
率
,
例
如
返
回
0.9
,
则
表
示
模
型在
此
X-y
数据
集
中
预
测
的
准
确
率
为
90%
。
对
于
回
归
任
务
,
score()
返
回
的
是
⼀个
叫
R
的
指
标
,
1.0
表
示
完
美
预
测
,
0
对
应常
数
模
型
(
预
测
任
意
新数据
都
是
训
练
集
输
出
的
平
均
值
,
没
有
预
测
意
义
)
。
#
默
认
为
'minkowski',
当
p = 2
时
产
⽣
标
准
欧
⼏
⾥
德
距
离
。
#
# metric_params dict,
默
认
=None
。
度
量
函
数
的
附
加关
键
字
参
数
。
#
# n_jobs int,
默
认
=None
。
为
邻
居
搜
索
运
⾏
的
并
⾏
任
务
数
(
利
⽤
CPU
的
数
量
)
。
#
如
果
为
None,
除⾮
在
joblib.parallel_backend
上下
⽂
中
,
否
则
表
示
1
。
# -1
表
示
着
使
⽤
所
有
CPU
核
数
。
33
34
35
36
37
38
classes_ # array of shape (n_classes,)
分
类
器
已
知的
类
标
签
effective_metric_ # str or callble
使
⽤
的
距
离
度
量
effective_metric_params_ # dict
度
量
函
数
的
附
加关
键
字
参
数
。
n_features_in_ # int
拟
合
期
间
看
到
的
特
征
数
feature_names_in_ # ndarray of shape (n_features_in_,)
拟
合
期
间
看
到
的
特
征
名
称
n_samples_fit_ # int
拟
合
数据
中
的
样本
数
outputs_2d_ # bool
当
y
的
形
状
在
拟
合
期
间
为
(n_samples, )
或
(n_samples, 1)
时
为
False,
否
则
1
2
3
4
5
6
7
fit(X, y) #
从
训
练
数据
集
中
拟
合
k
最
近邻
分
类
器
get_params([deep]) #
获
取
此
估
算
器
的
参
数
kneighbors([X, n_neighbors, return_distance]) #
求
⼀个
点
的
K
邻
域
kneighbors_graph([X, n_neighbors, mode]) #
计
算
X
中
点
的
k-Neighbors (
加
权
)
图
predict(X) #
预
测
所
提
供
数据
的
类
别
标
签
predict_proba(X) #
返
回
测
试
数据
X
的
概
率
估
计
score(X, y[, sample_weight]) #
返
回
给
定
测
试
数据
和
标
签
的
平
均
准
确
度
set_params(**params) #
设
置
此
估
计
器
的
参
数
1
2
3
4
5
6
7
8
2
内
容
来
源
:
csdn.net
作
者
昵
称
:
谢
TS
原
⽂
链
接
:
https://xiets.blog.csdn.net/article/details/130957522
作
者
主
⻚
:
https://xiets.blog.csdn.net
https://xiets.blog.csdn.net/article/details/130957522
4/17
估
计
器
有
许
多
属
性
,
有
些
属
性
以
下
划
线
_
结
尾
的
,
表
示
该
属
性
是
训
练
模
型
后
(
调
⽤
fit()
⽅
法
后
)
设
置
的
值
。
2.1
根
据
⼈
的
身
⾼
和
体
重
预
测
性
别
⼀
组
数据
,
身
⾼
和
体
重
对
应
的
性
格
:
身
⾼
(
输
⼊
特
征
)
体
重
(
输
⼊
特
征
)
性
别
(
输
出
类
别
)
158cm 64kg
男
性
170cm 66kg
男
性
183cm 84kg
男
性
191cm 80kg
男
性
155cm 49kg
⼥
性
163cm 59kg
⼥
性
180cm 67kg
⼥
性
158cm 54kg
⼥
性
178cm 77kg
⼥
性
构
建
k-NN
分
类
器
,
训
练
模
型
,
预
测
新数据
:
import matplotlib.pyplot as plt
import numpy as np
from sklearn import neighbors
#
输
⼊
数据
,
每
⼀
⾏
为
⼀个
样本
,
每
个
样本有
2
个
特
征
(
身
⾼
和
体
重
)
X = np.array([
[158, 64],
[170, 66],
[183, 84],
[191, 80],
[155, 49],
[163, 59],
[180, 67],
[158, 54],
[178, 77],
])
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
内
容
来
源
:
csdn.net
作
者
昵
称
:
谢
TS
原
⽂
链
接
:
https://xiets.blog.csdn.net/article/details/130957522
作
者
主
⻚
:
https://xiets.blog.csdn.net
剩余16页未读,继续阅读
资源评论
谢TS
- 粉丝: 1w+
- 资源: 23
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- JSP-JTBC-CMS(SQLITE).rar
- MC3362和MC145151调频无线接收器的设计.pdf
- MiniRenamer-v100.0一款简单易用的批量文件重命名工具(已注册PRO版本).rar
- 小狐狸Ai系统 小狐狸ai付费创作系统V2.8.0 ChatGPT智能机器人
- 公孙离-内衣-肚兜.zipgsl
- 快慢指针判断链表是否有环-go 语言实现
- 学生成绩管理系统的设计与实现-收藏备用.pdf
- JSP+SQL网站流量统计管理系统(源代码+论文).rar
- IBM-PC-XT微机过程...道中模拟量数据的采集和处理.pdf
- JSP+SQL网上选课系统(源代码+论文+答辩PPT).rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功